您現在的位置是:首頁 > 籃球

盲文資訊化助推互動無障礙

  • 由 光明網社會 發表于 籃球
  • 2021-12-16
簡介國家通用盲文實現了讀音規範化,分詞連寫問題成為國家通用盲文進一步規範化、資訊化的絆腳石

盲字怎麼讀什麼意思

作者:鍾經華(《國家通用盲文方案》課題組組長、北京聯合大學教授)

盲文是視力殘疾人語言文字權益的核心,是提高盲人文化教育水平的關鍵,是盲人共享文化權益、教育權益平等的保障。推進盲文資訊化、出版規範化,關乎我國1700多萬視力殘疾人文化素質的提高,關乎殘疾人實現全面小康的程序。這是“十三五”物質生活脫貧後,“十四五”視力殘疾人精神文化生活脫貧的攻堅戰。

“十三五”期間,由教育部、國家語委、中國殘聯釋出的《國家通用盲文方案》解決了近70年來一直懸而未決的盲文讀音不規範問題,在保持盲文穩定、新舊銜接的前提下,實現了盲文由“猜”到“讀”的轉變,結束了盲文“猜調”的歷史。國家通用盲文能夠準確地記錄國家通用語言的聲韻調,使我國盲人有了相當於漢語拼音功能的文字工具,能夠準確地使用國家通用語言。

國家通用盲文實現了讀音規範化,分詞連寫問題成為國家通用盲文進一步規範化、資訊化的絆腳石。在語料庫建設過程中,我們發現了盲文分詞連寫問題的全貌,違反語法、語義邏輯、語用習慣的現象俯拾皆是,零散的單音節大量存在。同一個語義單元內分寫,兩個不同語義單元之間連寫。盲人中間流傳的“該連的沒連、該分的沒分”典型示例大量湧現。

目前的分詞連寫不僅沒有實現提高盲文表義能力的初衷,還成為國家通用盲文規範化、資訊化最後的瓶頸。研製面向盲校教學等多領域的系統完整、邏輯自洽、細則簡明、可操作性高的分詞連寫規則已迫在眉睫。簡明分詞連寫規則配以高精度的智慧分詞連寫詞庫,以“規則+詞庫”的組合方式能兼顧盲文教學、出版及資訊化、規範化的需求。

從漢字到盲文的翻譯,核心難點在於分詞和讀音標註。盲文的分詞連寫規則涉及語義和語法資訊,很難被計算機描述和處理,導致基於規則的方法效能不佳。針對當前漢盲翻譯的問題,要引入最新的深度學習技術,基於機器學習模型自動學習盲文分詞規則和多音字、輕聲的辨析規則,實現高準確率的漢盲翻譯。

針對盲文與漢字分別儲存,盲文文件容易丟失對應的漢字資訊這一問題,需要研究和制定國家通用盲文全息(盲文-拼音-漢字)儲存標準,在字串級別實現盲文-拼音-漢字的對照儲存,使得盲人在閱讀電子盲文文件時,可以隨時根據需要獲取盲文、漢字、拼音中的一種或多種精確對照的資訊,並可進一步將其轉換為語音等其他通道資訊,實現多通道、多模態的全息閱讀體驗。

目前,盲文的校對環節還存在極大的提升空間。研究開發盲文翻譯“一明對多盲”支援技術。對盲文校對環節明眼人和盲人一對一配合,盲人摸讀盲文內容,明眼人對照原文進行檢錯和糾錯進行徹底的技術革新,實現盲人基本獨立無障礙完成校對流程,取代兩人協作帶來的工作流程複雜性、效率低、成本高的校對模式。

針對國家通用盲文出版應用研究問題,深度開發盲文編輯軟體的糾錯功能,支援樣本訓練、樣本學習,對不同使用者的手動糾錯結果進行資料複用。在正確理解原文內容的基礎上,實現校對流程的語音朗讀、盲文點顯器顯示,能夠使用計算機鍵盤快捷鍵在原文和盲文之間進行快速而直接的查閱和比對。引入線上聯網糾錯服務,實現自動對漢語文字中的分詞連寫、標調、標點、疑難詞等多種問題進行糾錯校對,同時在原文和盲文中提示錯誤位置並返回修改建議。實現快捷鍵在各糾錯結果之間進行檢視,對糾錯內容進行手動二次糾錯,使盲人可無障礙操作。

當前,移動電子裝置上的盲文資訊處理技術尚不完善,為縮小或消除“資訊鴻溝”,需要開展移動電子裝置盲文資訊處理技術研究及應用。重點突破智慧電子裝置上的盲文資訊化與互動無障礙問題。研究盲文與點位漢字編碼互轉的演算法,為盲文的語音識別與轉換奠定基礎。研究盲人觸控手勢採集、清洗、歸一化、資料標註、資料訓練、模型計算等關鍵技術。研究多重觸控手勢識別、盲文與手勢關係匹配等構建方法。研究國家通用盲文與語音雙向轉換,實現盲文的語音識別和語音輸出。

此外,開展數理化公式、電路圖、幾何圖、音樂樂譜盲文資訊處理關鍵技術研究也是加快推進盲文規範化資訊化的重要路徑。

《光明日報》( 2021年12月12日 05版)

Top