コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

プロジェクト‐ノート:Bot/データベースダンプ

ページのコンテンツが他言語でサポートされていません。

データベースダンプ

[編集]

ここには、データベースダンプを活用するための資源や情報を書き連ねていきます。見つけたら片っ端から追加していって、まとまったら技術文書にしちゃいましょう。

import xmlreader

for entry in xmlreader.XmlDump("jawiki-latest-stub-articles.xml").parse():
    print entry.title

標準名前空間すべてを対象に文字列置換を実施

[編集]

pywikipediaのreplace.pyの「-xml」オプションでXMLダンプデータファイルを指定することで、標準名前空間すべてを対象に文字列置換を実施することもできる。

python replace.py -xml:jawiki-20100317-pages-articles.xml -namespace:0 "[[ドラえもんの道具 (" "[[ドラえもんのひみつ道具 ("

データベースダンプ活用例

[編集]