Hilfe:Download
Die Wikipedia kann nicht nur online gelesen werden, es besteht auch die Möglichkeit, sich die gesamte Wikipedia auf den eigenen Rechner herunterzuladen, um offline darin zu lesen. Dazu braucht man eine bestimmte Software, die dann den Browser ersetzt, sowie den Inhalt der Wikipedia in einer nutzbaren Form darstellt.
Inhaltsverzeichnis |
[Bearbeiten] Wünschenswerte Funktionen
- eine unkomplizierte Installation
- eine einfache und sofort verständliche Benutzeroberfläche
- eine ausführliche Software-Dokumentation und Anleitungen
- eine gute Suchfunktion
- die Möglichkeit, verschiedene Sprachversionen der Wikipedia nebeneinander zu nutzen
- die Möglichkeit, weitere Wikimedia-Projekte zu nutzen
- nach Wunsch die Verwendung von Bildern (die wesentlich mehr Speicherplatz benötigen als reiner Text)
- möglichst aktuelle Versionen des Wikipedia-Inhaltes
- die Möglichkeit, veraltete Inhalte einfach und rationell zu aktualisieren
Leider gibt es keine Software-Lösung, die allen diesen Wünschen nachkommt. Manchmal stellt man fest, dass eine vielversprechende Software seit längerer Zeit nicht mehr verbessert wurde oder sich gar noch im "Beta"-Stadium (Versuchsphase) befindet. Oftmals erhält man auch keine aktuellen Versionen des Inhaltes der Wikipedia. Im folgenden erscheinen hier dennoch einige Lösungen, die das Lesen der Wikipedia offline recht gut ermöglichen.
[Bearbeiten] Offline-Browser
Lösungen mit einigermaßen aktuellen Inhalten:
- Kiwix ist ein Offline-Browser (Windows, OSX, GNU/Linux), den man auf seinem eigenen Computer installiert. Kiwix kann das von der Wikimedia Foundation bevorzugte openZIM Format lesen. Die deutschsprachige Wikipedia (mitsamt Bildern) vom Oktober 2010 macht 13 GB aus. Kiwix wird Peer-To-Peer Fähigkeiten erhalten, um das Laden von openZIM files zu vereinfachen bzw. auch einen Austausch in einem lokalen bzw Mesh Netzwerk zu ermöglichen. Mehr Informationen auf Englisch.
- Okawix ist ein Offline-Browser, den man auf seinem eigenen Computer installiert. Man kann in diesem Browser angeben, welche Wikimedia-Inhalte man haben möchte (zum Beispiel die Wikipedia auf Deutsch, Wikibooks auf Französisch usw.). Auch die Bilder (in niedriger Qualität) kann man herunterladen. Die deutschsprachige Wikipedia macht etwa 3,5 Gigabyte aus, die dazugehörigen Bilder 13 Gigabyte. Die Benutzeroberfläche verwendet teilweise recht kleine Buchstaben (in der Suchfunktion) und ist noch nicht völlig stabil, dennoch einfach handhabbar. Tipp: Während des Herunterladens von Inhalten, besonders bei den Bilddateien, sollte man den Okawix-Browser nicht verwenden. Nachteil: Die letzte Version der deutschsprachigen Wikipedia scheint aus dem September 2010 zu sein.
- WikiTaxi ist ebenfalls ein Offline-Browser für Windows, mit etwas sparsamerer Benutzeroberfläche, dafür stabiler. Man kann sich die Wikipedia in verschiedenen Sprachen herunterladen, sowohl ältere Versionen als auch eine ziemlich aktuelle (oft vom Vormonat). Bilder gibt es nicht. Siehe hier.
- MediaWiki ist die Software, die die Wikipedia selbst verwendet. Damit kann man ein aktuelles und voll funktionstüchtiges Abbild der Wikipedia auf dem eigenen Computer aufbauen. Allerdings setzt diese Lösung fortgeschrittene Software-Kenntnisse voraus und ist für den durchschnittlichen Anwender ungeeignet.
[Bearbeiten] Weitere Möglichkeiten
- Die DVD-Version, welche es auch zum freien Herunterladen gibt. Die letzte verfügbare Version stammt vom Herbst 2007. Die Weiterentwicklung der Software, die für diese DVDs verwendet wurde, gibt es als Freie Software zusammen mit allen Werkzeugen um eigene DVDs herstellen zu können beim openZIM-Projekt, welches von Wikimedia CH finanziert wird.
- Verfügbar ist auch eine HTML-Version der Wikipedia ohne Bilder auf dem Stand vom Juni 2008.
- Wie auf Wikipedia:Unterwegs beschrieben ist, existieren verschiedene Versionen für Offline-Leseprogramme wie Mobipocket oder Tomeraider, welche sowohl für verschiedene Betriebssysteme portabler Geräte wie teilweise auch für Windows verfügbar sind.
- So existiert beispielsweise eine Version auf Mobipocket (WPMP)-Basis (Download) (ohne Bilder) auf dem Stand vom Juni/August 2008 (Mirror).
- Es ist auch möglich, die Wikipedia im TomeRaider 3-Format offline zu nutzen. Die aktuelle Version ohne Bilder ist vom Juni 2009. Eine Version inklusive Bilder vom Januar 2009 ist ebenfalls (dort) erhältlich.
[Bearbeiten] MediaWiki-Lösung
Hier eine ausführliche Anleitung für Windows-Nutzer ohne jedes Vorwissen für die XML-Version – vom blanken Desktop bis zur fertigen Wikipedia (man benötigt einen Internetanschluss an dem Computer, an dem man die Offline-Wikipedia installieren möchte, oder transportiert die Daten per USB-Stick oder CD auf den Offline-Rechner).
[Bearbeiten] Herunterladen aller Seiten als XML-Dump
Die gewünschten Datensätze herunterladen. Am einfachsten ist es mit dem Dump der aktuellen Versionen der Artikel und einigen anderen Seiten: dewiki-??-pages-articles.xml (Datei). (RSS-Feed)
[Bearbeiten] Import in MySQL
Der Import der XML-Daten kann entweder über das langsame PHP-Skript importDump.php der MediaWiki-Software erfolgen (liegt im Verzeichnis maintenance/ der MediaWiki Installation), oder über das etwas schneller arbeitende Java-Paket MWDumper. Dieses benötigt eine funktionierende Java-Installation. Der Import erfolgt dann mit folgendem Befehl:
| mysql -u <username> -p <databasename>
Es ist wichtig, dass die Datenbanktabellen bis auf site_stats, user, user_groups und interwiki vollständig leer sind (TRUNCATE TABLE...), da sonst der Import fehlschlagen kann. Sollte ein Fehler auftreten, wird MWDumper dennoch weiter fröhlich das XML in SQL konvertieren, aber der mySQL-Server importiert nicht mehr. In diesem Fall prüfen, ob wirklich alle Tabellen leer sind, und von vorn beginnen.
Damit hat man die Artikelseiten in die Datenbank importiert und kann im Wiki lesen.
Der Befehl zum Leeren der Datenbanktabellen sieht übrigens wie folgt aus:
TRUNCATE imagelinks; TRUNCATE ipblocks; TRUNCATE job; TRUNCATE langlinks; TRUNCATE logging; TRUNCATE math; TRUNCATE objectcache; TRUNCATE oldimage; \
TRUNCATE page; TRUNCATE page_props; TRUNCATE page_restrictions; TRUNCATE pagelinks; TRUNCATE protected_titles; TRUNCATE querycache; TRUNCATE querycache_info; \
TRUNCATE querycachetwo; TRUNCATE recentchanges; TRUNCATE redirect; TRUNCATE revision; TRUNCATE searchindex; TRUNCATE templatelinks; TRUNCATE text; \
TRUNCATE trackbacks; TRUNCATE transcache; TRUNCATE updatelog; TRUNCATE user_newtalk; TRUNCATE watchlist;
[Bearbeiten] Linktabellen bauen
Für viele interessante Datenbankabfragen sind Informationen darüber notwendig, welcher Artikel auf welche anderen Ressourcen verlinkt. Die Selbsterstellung dieser Linktabellen ist allerdings ein zeitaufwendiger Prozess.
In seiner gegenwärtigen Fassung ist dieses Skript ein riesiges Speicherleck. Sobald der Rechner wegen Speichermangels auf die Auslagerungsdatei zurückgreifen muss, geht die ohnehin schon niedrige Ausführungsgeschwindigkeit des Skripts immer rascher gegen Null. Die Linktabelle sollte daher abschnittsweise erstellt werden, indem das Skript zwischendrin abgebrochen wird, man sich die letzte Position merkt und folgendermaßen wieder startet:
Auf diese Weise wird der unnötigerweise verbrauchte Speicher wieder freigegeben und die Erstellung der Linktabelle bei Artikel Nr. 228600 fortgesetzt.
[Bearbeiten] Optional: Textindex
Wenn man Volltextsuchen durchführen möchte, muss ein Textindex erzeugt werden. Dies geschieht über
Wikipedia selbst arbeitet übrigens nicht mit dieser relativ langsamen MySQL-basierten Suche, sondern verwendet Apache Lucene.
[Bearbeiten] Optional: Recentchanges aktualisieren
Wenn man wissen möchte, bis zu welcher Uhrzeit der installierte Datenbank-Dump reicht, kann man kurz
sagen, um die Seite „Letzte Änderungen” zu aktualisieren.
[Bearbeiten] Optional: Artikelanzahl neu berechnen
Die Anzahl der im Wiki vorhandenen Artikel und einige andere Zahlen können mit initStats.php neu berechnet werden:
[Bearbeiten] Ein Wort zur Hardware
Die Wikipedia-Datenbank stellt mittlerweile recht hohe Ansprüche an leistungsfähige Hardware. Zur besseren Einschätzung daher einige Erfahrungen aus der Praxis: Wenn man nur lesen möchte, genügt ein Rechner der 1-GHz-Klasse mit wenig RAM. Für anspruchsvollere Aufgaben wie Wartungsseiten, SQL-Abfragen, selbst gebaute Linktabellen oder den Import der old-Tabelle sollte man aber eine bessere Hardware zur Verfügung stellen: 1 GB RAM oder mehr und ein möglichst schneller Prozessor mit mehr als 3 GHz oder Multicore-Prozessoren sind sehr sinnvoll, ebenso wie schnelle Festplatten (am besten als RAID). Die Tabellen sollten im MySQL-Server möglichst als InnoDB abgelegt sein, damit die Antwortzeiten kürzer werden (allerdings auf Kosten des Speicherverbrauchs). Anmerkung von Benutzer:Echoray: Diese Faustregel basiert noch auf Erfahrung mit der alten MediaWiki-Software 1.3 und MySQL 4.0. Mit MyISAM waren die Linktabellen einfach zu ineffektiv. Ich habe den Verdacht, dass der Rückgriff auf den Filesystem-Cache des Betriebssystems einfach nicht so gut ist wie der dedizierte Cache, den InnoDB bietet. Das kann mit neuerer Software inzwischen anders sein. Jemand könnte das mal meßtechnisch erfassen …
[Bearbeiten] Herunterladen einzelner Seiten
Unter Spezial:Export kann man sich einzelne oder mehrere Seiten in XML herunterladen.