新華社11日報導,中國最大的藏文搜尋引擎「雲藏」目前已經計入內部測試階段,預計今年下半年就可以正式開通。中國新聞網稱,從2013年4月開始建置的「雲藏」搜索引擎上線後,可望填補藏文在網路世界的許多空白。
藏文至少已有1300多年的歷史,主要通用於青康藏高原一帶,但藏文搜索引擎研發尚處於起步階段。據才洛估計,目前已知的藏文網頁超過6700萬個。等「雲藏」搜索引擎上線後,在西藏、青海、四川、甘肅、雲南等地的潛在用戶在200萬人左右。
「雲藏」搜尋引擎是由青海省海南藏族自治州藏文信息技術研究中心所研發,目前已基本建置了網頁、圖片、新聞、影片、百科等板塊,收錄了歷史、文學、宗教、醫學、自然、各類詞典等25類資料。除了藏文數據庫之外, 作為藏文搜索引擎核心技術的藏文自動分詞技術,目前也已取得突破。
據「雲藏」負責人、海南州藏語文工作委員會主任才洛介紹,「雲藏」是藏文的音譯,指「博學的老師」,同時有「全面獲取、完全掌握」的意思。才洛說,該系統的藏文搜索正確識別率目前可達95%以上,並具有較強的糾錯功能。
不只搜尋引擎 更是入口網站
青海的《西海都市報》去年曾報導,「雲藏」除了搜索引擎之外,更是一個大型的藏文入口網站,內容包括藏文百科、自動問答、新聞、網頁、圖片、影片、百科、文庫、知道等板塊,後期還將增加閱覽器、自動翻譯、電子信箱等內容。
中國積極研發藏文軟體
除了「雲藏」搜尋引擎之外,西藏大學藏文信息技術研究中心也研發了藏文信息技術編碼字符集、藏漢英智能語音教具系統、藏文智慧型手機等。青海師範大學計算機學院則在建置漢藏口語平行語料庫,目前該校已經完成10萬句對的建設,1萬句藏語口語平衡語料庫的測試與校對工作。
西藏大學藏文信息技術研究中心研發的「點讀機」,目前則已經推廣到西藏自治區的中小學校,可以念出標準的漢語和藏語的語音。《國際在線》稱,這項研發成果可以讓生活在地理位置偏僻、信息閉塞的藏族孩子們,獲得更好的教學資源。