中国、新興国の「今」をお伝えする海外ニュース&コラム。
2012年06月29日
Pauls PC / njt1982
最近、中国でひそかなブームとなっているのが「ネット世論観測システム」。以前に記事「ネット世論観測産業の勃興=民の声に怯える政府が大口顧客―中国」でも紹介したことがある。ネット掲示板、ブログ、マイクロブログ、ニュースのコメント欄の書き込みを分析し、次に炎上しそうな社会不安のタネを早期発見しようというシステムだ。
すでに複数の企業がネット世論観測システムを開発しているほか、人民日報社は「ネット世論」なるレポートを販売している。へんに炎上して自分の出世に関わっては一大事。官僚様必読のレポートかもしれない。
さて中国独自のニーズに基づき発展が続いているネット世論観測ビジネスだが、ネックは少数民族言語だという。基礎研究が乏しくデータベースが不足しているなどの問題から有効な観測ツールはまだない。そのためいまだに人力に頼るのが一般的。問題が起きることを恐れ、チベット語やウイグル語など少数民族言語のサービスはなかなかリリースできないのが現状だという。
この問題を詳しく伝えている鳳凰週刊の記事が面白かったので、ざっくりとご紹介したい。現在、少数民族言語のネット世論観測システムの開発に力が注がれているが、たんに監視対象ワードをチェックするだけではなく、文章の意味を読み取る高度なシステムの構築が最終目標だという。こうしたシステムが完成した暁には発言を消すのではなく、積極的に書き込ませた揚げ句に危険人物を捕まえるというようなワンランク上の監視国家が登場するのではないか。
なお中国政府の努力でウイグル語文字コードが国際基準になったとか、ツッコミどころも少なくないことにご注意されたい。
中国本土、チベット語・ウイグル語のネット世論観測システムを研究=独立リスクを監視鳳凰週刊、2012年6月25日
中国西蔵網はチベット語ブログサービスの導入を検討していたが、最終的に計画を一時中止することが決めた。コンテンツ監視の観点から見て公開前の審査が必要だが、それに時間がかかりすぎれば、あるいは審査に問題が起きればネットユーザーの批判を浴びることにある。現在、チベット語サイトのコンテンツ監視はなお人力に頼っている状態で、多額のコストが必要となる。
国家重点ニュースサイトとして、同時に中国本土最大のチベット関係サイトとして、この懸念は決して杞憂ではない。2012年2月以来、焼身抗議事件の影響を受け、中国本土の人気チベット語サイトは一部が閉鎖されている。青海湖網は「一部ユーザーは本ブログサービスの趣旨に合致しない記事を公開しているため、一時サービスを閉鎖する」と通達した。
また海外メディアの報道によると、著名なチベット語ブログ「Sangdhor.com」も閉鎖されたという。「原因は同サイトが発表した詩「哀悼」がチベットの焼身抗議事件を描いたため」だった。
現在、中国のネット世論観測システムはすでに成熟した研究成果を上げているが、少数民族言語の文字情報化処理レベルは遅れている。監督部局はまだ少数民族言語のウェブサイトに対して、成熟した世論調査ソフトウェアを持ち合わせていない。そのため一部の敏感事件が発生すると、サイトを閉鎖することで日増しに複雑化しているネット世論に対抗するのだ。
中央民族大学などの研究機関では、現在「チベット語・ウイグル語におけるネット敏感情報自動発見・警戒技術」のテーマ研究が進んでいる。あるいはこの研究が現行の管理方式を変え、ウェブサイト管理者の負担を減らすものとなるかもしれない。
■チベット語、ウイグル語サイトが重点管理目標
中国インターネット情報センター(CNNIC)の報告書「第28回中国インターネット発展状況統計報告によると、2011年6月末時点で中国本土のネットユーザー4億8500万人に達した。市民が中国語ネットの使用にますます熟練していく中、少数民族言語のウェブサイトの管理も当局のタイムスケジュールに盛り込まれている。
中央民族大学情報工程学院の趙小兵教授は、国家語源資源観測・研究センター少数民族言語分センターの副主任を務めている。同氏によると、現在、少数民族言語を使用しているウェブサイトはそう多くはない。主にモンゴル語、チベット語、ウイグル語、カザフ語、キルギス語、朝鮮語、イ語、チワン語、タイ語、新タイ語の9民族10言語だという。同センターの調査では2011年時点で、中国本土の少数民族言語サイトは389。うちウイグル語が175サイト、チベットが109サイトだった。
1999年12月、世界初のチベット語サイトが西北民族学院に設立された。この後、チベット語サイトの数は急速に増加していく。
多くのチベット語掲示板、チベット語ブログが登場した。チベット語サイトの数は2009年の45サイトから2012年には130サイトに増えている。またネットユーザーの増加率で見ると、チベット人ネットユーザーの伸び率は86%増と全国平均をはるかに上回るペースだ。
ネットの普及は今、チベット人の生活方式を変えている。チベット仏教寺院にある仏学院では、一部で修行僧向けにコンピューター学習コースを設け、タイピング、DTP、サイトデザインなどを教え、独自のサイトを開設している。チベット人の便宜を考え、当局はチベット語情報処理の研究に力を入れてきた。1997年、チベット語文字コードは中国で初めてとなる国際基準のコードとなった。
1998年、新疆ウイグル自治区に初のウイグル語サイト「タクラマカン(塔克拉玛干)」が誕生した。それから十数年、ウイグル語サイトも一定の規模を備えるようになった。しかし2009年7月5日のウルムチ騒乱の後、新疆のサイト数は減少へと転じた。その原因は新疆ウイグル自治区通信監理局が自治区の登記ウェブサイトについて電話で確認をしたため。2009年7月から12月までに「被経営的ネット情報サービス登記管理弁法」に基づき、登録されたサイト数は4966サイトに登る。
■世論観測の現実的困難
少数民族ウェブサイトは中国国内での成長と同時に、国外でもその数を増やしていた。環球時報が外国メディアを引用して報道したところによると、2008年のチベット騒乱後、大量の「チベット独立」サイトが登場。チベット亡命政府はチベット人を引きつけ、中国と対抗する武器としてインターネットをとらえていると報じている。
チベット騒乱から1年後のウルムチ騒乱で、中国政府は再びインターネットの効果に注目した。騒乱の前にウイグル語ウェブサイトは広東省韶関市の玩具工場で起きたチベット人と漢人の乱闘事件に関するニュースを大量に転載し、ネット掲示板を利用してデマを流し扇動していた。騒乱前日の7月4日、一部ネットユーザーはQQグループ、ウイグル語ネット掲示板、個人ブログを通じて、世界ウイグル会議のデモの呼びかけに呼応しようと書き込んでいた。
ある中国本土の研究者は「ウイグル騒乱はウイグル語個人サイトが世論の重要な窓口になっていることを我々に知らしめるものになった」「現在、一部のウイグル語個人サイト・ネット掲示板は海外の情報を転載し、虚偽の情報を報道し、一部に悪い影響を与えている。ウイグル語ニュース情報、とりわけ時事・政治関連の情報の宣伝は大きな安全リスクを抱えている」とコラムに書いている。
その後、ますます多くの少数民族が自分たちの文字を使い、ネットを通じて、感情や態度、意見や要求を表明し、少数民族地域のネット世論を形成するようになった。多くの研究機関や企業はクライアントにネット世論観測サービスを提供可能だと主張している。ネット世論観測システムとはごく短時間でニュース、ネット掲示板、ブログなどの情報を収集し、分類し、ふるい分けるもの。またキーワードを指定してリアルタイムの監視も可能で、ネット世論の発展トレンドを全面的に分析し、政策的決定の参考とし、リスクを警告するものである。
しかし政府によるチベット語世論観測はいまなお伝統的な、人間の目による監視にとどまっている。人民網世論観測室はモンゴル語、チベット語、ウイグル語、カザフ語、朝鮮語など少数民族言語の世論リポートをまとめているが、これも人間が検索・分析したもの。中国語の世論観測リポートと比べると、非科学的なツールだ。
谷尼国際ソフトウェア公司は「谷尼インターネット世論観測システム(他言語版)」を開発し、ウイグル語、スラブ系言語、ラテン語表記ウイグル語の監視サービスを提供している。中科クリック科技有限公司の「軍犬ネット世論観測システム」は「チベット語、ウイグル語、イ語、朝鮮語など少数民族言語の世論情報を監視可能」とうたっている。谷尼社のあるスタッフはチベット騒乱、ウイグル騒乱の後、少数民族言語の監視ニーズは明らかに増加したと話している。政府の宣伝部局だけではなく、警察、安全保障部局もクライアントとなった。
しかし谷尼社のサービスは現在、定期的な情報収集とネット検索のサービスしか機能を備えていない。中国語の世論観測システムにあるようなコンテンツ感情分析、テーマワード自動解析、全文検索などのサービスはいまだ実装されていない。その主な理由は少数民族言語に関連したキーワード・リスト、データベースが存在しないためだという。これらは関係する学術機関の基礎研究を待つしかないという。
■監視対象情報を予報せよ
現在、中国本土で少数民族言語の情報処理を担当している学術機関はそう多くはない。主に中央民族大学、新疆大学、内モンゴル大学、西北民族大学、青海師範大学、中国社会科学院などの大学、研究機関に集中している。少数民族ネット世論観測システムの応用ニーズが高まる中、中国本土では研究に補助金が投下されている。
中央民族大学は「チベット・ウイグル語ネット敏感情報自動発見・警告技術研究」のテーマを引き受け、国家民族事務委員会の補助金を獲得している。西北民族大学国家民族情報技術研究院も関連研究を進めており、「チベットウェブサイトに基づくネット世論観測システムの研究」は国家863プロジェクトの「多言語基礎リソース・データベース研究・共有」の資金を獲得した。
趙教授は「チベット語譲歩処理技術は中国語や英語と比べて遅れています。文字コードの不統一、チベット語の単語分解技術が未成熟であることが問題で、対象ワードの監視や話題の発見・追跡は困難となり、世論観測の質そのものに影響しています」と話している。
また趙教授によると、問題のキーワードがあるかどうかだけをチェックし、対象ワードを発見するとフィルタリング、削除するというやり方では、ミスが増えマイナス面が大きすぎると指摘する。「少数民族言語が持つ含意は非常に豊かです。同義語が多く、監視対象ワードを使っていたとしても、そうした意図を伝える文章ではないかも知れません。逆に監視対象ワードを使わずに問題ある内容を伝えることができます。こうした言語の多義性と複雑性は、私たちの監視ソフトウェアがより賢く、言葉の真相の含意を読み取って判定することを求めているのです。たんに表面的な言葉のみを検出するのではありません。つまり単純な管理ではなく、人間的な、スマートな管理が求められているのです。」
西北民族大学が開発した世論観測システムは、現時点でチベット語ウェブサイトの「敏感なポイント」を監視し、ホットトピックを予報する機能を持っているという。これまでに人間に頼った世論観測が抱えていた問題を解決する力があり、政府によるチベット地区の世論把握とネット文化の安全を守るために貢献できるという。
また中国公安部局も現在、チベット語世論観測システムを開発中だ。その目的は海外チベット語サイトの情報を収集し、「三つの勢力(敵対勢力、独立派、テロ組織)の最新動向を把握することにある。このシステムはすでに公安内部でテストが始まっている。
現在は義儒的な未成熟から、少数民族サイトの運営には大変な負担がかかる。CGM(ユーザーがコンテンツを作る)型のブログやマイクロブログの開設は容易ではない。たとえ開設できたとしても、まず審査してから公開することが必要だ。
ウイグル自治区党委員会宣伝部が運営する天山網は現在、中国本土で唯一、ウイグル語マイクロブログを提供している。2012年3月のオープン以来、ユーザー数は3万人を超え、つぶやき数は1日5000件を越えている。現在、管理員3人が24時間体制で審査を行っている。1人当たり1日1500件以上をチェックしている計算だ。ユーザーの増加に対し、現在は管理員を増やすしか手立てはない。