四庫全書v.2で…

ちょっとあいてしまいましたが、春節前、北京で中易と創新力博に行ってきました。


中易関係はそんなに発展がありませんねえ。唯一おもしろかったのが、国家図書館の陳力氏が昨年末、国家図書館の地方志データベースは将来的に無償公開すると公約した、って話くらいかなあ。これも、うん億字クラスのデータベースですからねえ、完成すればインパクトは大きいでしょう。

創新力博は、訪問した日にちょうど四庫全書v.2のデータが完成したとろろでした。で、v.2、文字数が7億字から11億字に増えるんだそうです。地方志その他の表を完全にテキスト化したおかげですね。さら~に、それらの入力過程で、Ext.B未収録文字が4万字くらい出てきたんだとか……。うおー、これはまたUnicodeに追加申請されるのかなあ?うーむ。(数字はうろ覚えなので、今度確認しておきます。)

四庫v.2の発売時期は、今年年末くらいになるだろう、とのこと。データはできたけど、システムの改修はこれからってことみたいです。こーゆーのは、遅れるのが常だから、たぶん来年にずれ込むんじゃないかな。でも、旧版持ってるところは買いにくいでしょうねえ。
comments (0) | trackbacks (0)

電脳 > 電脳中国語処理

Comments

Comment Form

com_End

Trackbacks

tb_End

中華・電脳マキシマリズム

ホラとヨタ話の電脳瓦崗寨ブログ

中华、电脑Maximalism
-大话、戏说电脑瓦岗寨博客-

CALENDAR
CATEGORIES
NEW ENTRIES
RECOMMEND
【電脳中国学〈2〉】…Windows 2000+Offrice XP環境対応、多漢字・中国語など人文情報処理マニュアル
電脳中国学〈2〉

Book (発売日:2002/04)
RECENT COMMENTS
RECENT TRACKBACK
ARCHIVES
PROFILE
OTHER