Импортировать Википедию - получить соответствующие статьи на разных языках

Я импортировал дампы базы данных Википедии (версии pages-articles.xml) из двух соответствующих языков, на английском и мальтийском языках.

Однако мне нужно уметь связывать статью с одного языка на другой. У меня создается впечатление, что для этого мне нужно импортировать дополнительные таблицы. Какие таблицы мне нужно импортировать?

Спасибо заранее!

Репозиторий дампа Maltese db: http://dumps.wikimedia.org/mtwiki/20121012/

Английский репозиторий db dump: http://dumps.wikimedia.org/enwiki/20121001/

2 ответа

Эта информация находится в таблице langlinks, поэтому вам нужно загрузить langlinks.sql.gz, который является дампом SQL, а не XML.

Одна из возможных проблем заключается в том, что эти ссылки не могут быть симметричными, поэтому, например, en:A может ссылаться на mt:B, но mt:B ссылки на en:C. Вы должны решить, что с этим делать.


Если я правильно понимаю, вы хотите создать английскую вики и викторину на Мальте и связать их друг с другом.

Чтобы сделать это, вам нужно добавить межъязыковые префиксы для "en" и "mt" в таблицу interwiki. Вот описание его:

https://www.mediawiki.org/wiki/Interwiki_link

Вероятно, вы должны удалить ссылки со всех других языков из статей. В противном случае они будут отображаться как хлам в нижней части большого количества статей.

P.S.: Замечательно слышать, что вы работаете с мальтийским языком! Мне это очень нравится:)

licensed under cc by-sa 3.0 with attribution.