it-swarm-ja.tech

MediaWiki記事の自動分類または索引付け

特定の科学分野の何千もの記事があるMediaWikiインスタンスがあります。それらは分類のない平らな空間にあります。データマイニングと言語処理技術を使用して、これらを自動的に整理したいと思います。理論的には、各ドキュメントで 統計的に考えられないフレーズ を探すのが良い出発点になると思います。

現在、MediaWiki APIを介してそのようなことを行うことができます。ドキュメントをプルダウンして分析し、カテゴリまたはタグを自動的に書き戻します。

しかし、これを行う別の方法はありますか? Webを見回すと、この種の問題全般に多大な労力が費やされていることがわかりますが、自動化された統合ソリューションでMediaWikiと具体的に連携するものはありません。そのようなことはありますか?

6
mattdm

これは部分的な解決策にすぎませんが、 テキストの置換 拡張機能を使用すると、特定のテキストに基づいてカテゴリをグローバルに追加できます。もちろん、統計的にありそうもないフレーズが配置されていた場所に分類テキストが表示されます:

統計的にありそうもないフレーズ

統計的にありそうもないフレーズ+カテゴリ」に置き換えます

2
Wikis