智能手機軟體簡介:
1 InSun語句級手機拼音漢字輸入法簡介
InSun語句級手機拼音漢字輸入法,是由哈爾濱工業大學智能計算研究中心經過十多年的潛心研究,采用最新計算機人工智能和計算語言學技術開發的語句級數字鍵盤智能漢字輸入方法,該輸入方法繼承了其PC機版本(音聲輸入方法、Windows微軟拼音、Macintosh Bopomofo)易學性好、輸入速度快、智能水平高的特性。整個系統僅占用不到150K內存,可被應用到手機、PDA、遙控器、點播器等多種小型移動設備上。
該輸入法具有以下特性:
◆ 以語句或短語為輸入單位,輸入連貫,不中斷人的思維
◆ 能夠同時消除數字鍵盤拼音輸入通常面臨的拼音字母按鍵歧義、拼音組合歧義和同音多字歧義
◆ 拼音輸入可采用等長碼三拼輸入方法,三鍵確定一個標准拼音,進一步降低漢字輸入的平均碼長,提高音字轉換准確率
◆ 系統自適應能力強,記憶學習效果好,符合人的記憶習慣
◆ 具備高數據壓縮比,整個系統僅占用不到150K內存,適用於資源受限環境
◆ 廣泛適用於手機、PDA、遙控器、點播器等小型移動設備
2 版本說明
版本:Windows Mobile 1.0版。
本說明書隨著軟體版本的升級將隨時修改,恕不另行通知。
3 系統環境說明
硬件環境:多普達575、585等基於Windows Mobile系統的手機。
軟體環境:Windows Mobile 2003 SE, Windows Mobile 5.0 (不同的安裝包)。
4 InSun語句級手機輸入法的安裝與卸載
4.1 InSun語句級手機輸入法的安裝
1、下載INSUN手機輸入法的安裝程序InSunIM.cab,置於硬盤或其他PC機存儲介質中;
2、用手機隨機光盤中的Microsoft ActiveSync同步軟體將手機與PC機連接,此部分請參考手機說明書中的ActiveSync部分。通過ActiveSync將安裝包發送到手機,並在手機上執行。
3、根據手機屏幕提示安裝完成後重新啟動智能手機。
4、重啟後進入文本編輯器,右上角出現提示“全”則表明安裝成功,並進入全拼輸入模式。以短信息編輯器為例,安裝成功後的界面如下圖所示:
圖1 安裝成功並進入全拼輸入模式
4.2 InSun語句級手機輸入法的卸載
依次選擇“開始”“設置”“刪除程序”,然後選擇InSunIM,點擊“菜單”“刪除”便可以刪除InSun手機輸入法。
5 InSun語句級手機輸入法的使用
5.1 Windows Mobile手機按鍵說明
圖1 Windows Mobile 智能手機鍵盤布局
5.2 InSun語句級手機輸入法的按鍵設置
InSun手機輸入法對Windows Mobile系統標准鍵盤的定義如下:
(1) “確認鍵”和數字鍵“0”。在輸入完一個拼音之後,按“確認鍵”或輸入“0”鍵對輸入的拼音進行確認;在按一次確認鍵後,按左或右方向鍵便可進入語句編輯狀態,對轉換的漢語句子或短語進行插入、刪除、修改等編輯操作;在語句編輯狀態,再次按“確認鍵”或“0”鍵表示結束編輯,確認所輸入漢字並進行強記學習。
(2) 數字鍵“1”。符號健。在候選漢子列表不顯示的情況下按此鍵便會出現符號選擇窗口,此時通過上下健翻頁選擇對應的標點符號。在候選列表顯示的情況下與“2”-“9”鍵一起作為選擇鍵。如果需要完整符號列表可長按此鍵進入完整符號列表。
(3) 數字鍵“2”-“9”。在拼音輸入狀態下,用於輸入漢語拼音字母,欲輸入一個拼音字母,只需按一次其對應的數字鍵即可;在候選拼音、同音字或標點符號選擇狀態下,與“1”鍵一起作為選擇鍵。
(4) 方向鍵。左右方向鍵用於進入語句編輯狀態,並在當前編輯語句的各個漢子間移動,此時候選列表會自動顯示,如果要插入漢字需按“確認鍵”或數字鍵“0”關閉候選拼音或候選漢子窗口,然後繼續輸入即可。上下方向鍵為翻頁鍵,進行同音字選擇時,如果當前頁不存在所需漢字,需要翻頁處理,直到找到所需漢字。語句編輯狀態下可對光標前的漢字進行修改、刪除,或在當前光標位置插入漢字。
(5) “*”鍵。長按“*”鍵便可在全拼、三拼、英文字母以及數字狀態健轉換。在英文字母輸入狀態下,短按此鍵會在大小寫輸入狀態間切換。
(6) “#”鍵。短按此鍵為空格鍵。 長按可打開幫助信息窗口。
(7) 清除鍵。在拼音輸入過程中,用於刪除光標前面的拼音字母;在語句編輯狀態下,用於刪除光標前面的漢字。
5.3 InSun語句級手機輸入法的全拼輸入方式
拼音是InSun手機輸入法的基本輸入單位。數字鍵盤中每個數字鍵對應多個拼音字母鍵,在輸入拼音時存在字母確認和拼音切分的歧義,拼音輸入必須采用靈活多樣的方式消除這些歧義。組成合法拼音的字母間存在上下文依存關系,可以此過濾掉非法的字母輸入,從而消除字母確認歧義;拼音確認歧義需通過系統根據拼音語言模型自動確認,或由用戶輸入確認鍵來消除。本輸入法的全拼輸入過程采用以下幾種方式:
1、 用數字串代替標准拼音串,數字拼音之間需輸入拼音確認鍵,如用0作為確認鍵。例如輸入漢字串“中國哈爾濱”,則應輸入對應的數字拼音串為“94664048604203702460”。
明確輸入拼音確認鍵是因為相鄰兩個拼音連續輸入時存在界限劃分的歧義。比如對標准拼音而言,字符串“shengen”既可切分為“shen”和“gen”,也可切分為“sheng”和“en”。其相應的數字串“7436436”至少可切分為兩種結果:“7436”和“436”,或“74364”和“36”。有時一個字符串既可看作一個拼音,也可看作兩個拼音,如字符串“xian”,其本身是一個合法拼音,同時也可看作兩個拼音“xi”和“an”的組合,其相應的數字拼音也存在同樣問題,且類似現象更為嚴重,不同的切分結果可能更多。一個未切分的數字串可以對應多種數字拼音的組合。如根據實驗結果,數字串“423724674443634543324364744”可切分為多達189種合法的數字拼音組合。
人工輸入拼音確認鍵,增加了按鍵信息,本輸入法可以自動對數字串進行切分,確定最合理的切分結果。
2、 連續輸入數字拼音,無需用戶輸入確認鍵。例如輸入“中國哈爾濱”,輸入的對應數字串為“946644864237246”。正確地切分數字拼音由系統自動處理。
這種方式的弊端是有時會發生拼音切分錯誤,此時需要額外的錯誤修正過程。
3、 以上兩種方式的混合運用。用戶根據經驗在認為可能出現切分歧義的情況下對數字拼音進行人工確認,即輸入確認鍵,其他情況下由系統自動切分。在用戶輸入過程中,如果發現拼音切分錯誤也可以及時糾正,這樣可以減少後續的拼音切分和拼音漢字轉換錯誤。這種靈活輸入方式能在盡量降低擊鍵次數的同時保證輸入的准確性。因而提倡使用混合輸入方式。
5.4 InSun語句級手機輸入法的三拼輸入方式
拼音輸入還可以采用等長的壓縮拼音形式----三拼輸入法。
三拼輸入法利用鍵盤布局和屏幕提示的方式為拼音分類,拼音輸入轉化為根據提示選擇分類的過程。這種方法三鍵確認一個標准漢語拼音,拼音漢字轉換程序可以直接針對標准漢語拼音進行處理。由於輸入不同拼音的擊鍵數相等,所以無需額外的拼音確認鍵,也不存在自動切分拼音的難題,可進一步減少拼音輸入的擊鍵次數,降低系統的複雜度,同時由於輸入的漢語拼音是確定的,減少了候選漢字的數量,可進一步提高漢字轉換結果的准確率。
三拼輸入法拼音分類和描述規則:
1、類的描述由已輸入拼音字母、待輸入拼音字母和省略符號“-”組合而成。
2、第一鍵根據鍵盤布局定義輸入拼音的第一個字母,第二鍵根據屏幕提示的分類輸入對應數字,第三鍵根據屏幕提示選擇拼音。
3、第二鍵的分類方法:對應同一聲母(包活單字符聲母和三個雙字符聲母sh,zh,ch)的拼音通常歸類於三種類型:1、i類,以拼音聲母加上“i-”表示該類,包含聲母起i作為下一個拼音字母的所有拼音;2、u類,以拼音聲母加上“u-”表示該類,包含聲母起u作為下一個拼音字母的所有拼音;3、其他類,以拼音聲母(韻母拼音對應首字母)加上“-”表示該類,包含去除上述拼音類裏所有拼音的其他拼音。當某個i類或u類只包含一個拼音時,可將該拼音歸為“其他類”。
4、第二鍵屏幕提示矩陣中,聲母相同的各子類只能處於同一列,但每列可以包含一或兩個不同的聲母分類。
5、通常第二鍵分類與鍵盤布局對應為:“其他類”對應第一排字符鍵,i類對應第二排字符鍵,u類對應第三排字符鍵。下面情況除外:當某列包含不同的聲母分類時,按類描述符號的字符順序從小到大排列。
6、第三鍵的分類方法:對應一個二級類的所有三級子類即拼音按照字母順序從小到大排序。
5.5 InSun語句級手機輸入法輸入狀態
InSun手機輸入法是語句級漢字輸入法,為理解和描述方便其輸入過程可區分為兩個交替變換的狀態:
1、輸入狀態:此狀態下,通常為一個連續的拼音輸入過程,輸入的拼音可隨時轉換為漢字串,在按下“確認鍵”後,進入句內編輯狀態。
2、句內編輯狀態:拼音到漢字的轉換往往達不到100%正確,用戶輸入也可能出現錯誤,此狀態下,對之前音字轉換的結果進行必要的刪除、插入、修改等編輯操作。
5.6 InSun語句級手機輸入法界面設計
1、InSun輸入法全拼輸入示例:
圖2 拼音輸入狀態 圖3 確認後按左方向鍵進入語句編輯狀態
拼音輸入狀態下的拼音候選列表在屏幕下方顯示,帶有下劃線的漢字表明當前正在編輯的語句。點擊左或右方向鍵進入語句編輯狀態,此時會出現漢字候選及對應的拼音候選(如果拼音候選唯一,則不顯示拼音候選窗口)。
上下方向鍵可以選擇拼音,同時對應的漢字候選隨之更新。此時按對應的序號便可選擇漢字,如果漢子沒有在第一頁漢字候選中,按“確認鍵”關閉拼音候選窗口,接著按翻頁鍵便可查看所有候選漢字。語句編輯狀態下再按一次確認鍵便可得到最終結果。
2、InSun輸入法三拼輸入示例:
圖4 三拼模式下輸入“9” 圖5 三拼模式下繼續輸入“3”
(1) 以輸入“字”為例,根據現有鍵盤布局定義按“9”(對應“wxyz)鍵,系統提示出圖4所示的拼音分類。
(2) 根據分類提示輸入“3”(對應“z-”)鍵,系統提示出圖5所示拼音分類(對應最終拼音)。
(3)根據分類輸入“*”(對應“zi”)鍵,完成拼音“zi”的輸入。在語句輸入狀態下,此拼音直接參與音字轉換,轉換結果被直接顯示出來,如圖6所示。下一步可以接著以同樣方式輸入下一個拼音,如果要修改已輸入漢字,按左鍵進入語句編輯狀態。由於三拼唯一地確定了一個漢字拼音“zi”,其候選拼音列表不會被顯示。如圖7所示。在語句編輯狀態下再按一次確認鍵便可得到最終結果。
圖6 三拼模式下繼續輸入“*” 圖7 確認後按左鍵進入語句編輯狀態
3、標點符號輸入示例:
圖8 按“1”打開標點符號輸入窗口 圖9 長按“1”進入完整符號列表
在全拼或三拼輸入模式下,關閉候選列表後按數字鍵“1”可打開標點符號輸入窗口,如圖8所示。此時可上下翻頁查找所需符號,並按數字鍵進行選擇。數字鍵“1”提供常用的全角符號,如果需要其它符號可長按“1”鍵進入完整的符號列表,並用方向鍵選擇所需符號,如圖9所示。
此外,按住“#”鍵可顯示簡單幫助信息及版權信息,如圖10所示。
圖10
5.7 InSun語句級手機輸入法的機器學習
拼音到漢字的轉換不可能達到100%正確,本輸入法能夠自動學習用戶知識,不斷提高音字轉換的准確率。
機器學習分為兩種方式:
1. 強制學習。輸入拼音串並經過音字轉換後如果存在音字轉換錯誤,則需對錯誤進行修正。在經過修正後按強制學習鍵“確認鍵”或(“0”),系統會記憶用戶知識,下一次輸入同樣內容能保證轉換正確。
2. 自然學習。輸入法也可逐漸學習用戶知識,經過一段時間的學習、記憶使特定語言現象在候選中的優先性逐步提高,當達到最高時,可使此語言現象的音字轉換達到完全正確。
目前采用的是強制學習方式。
系統的知識記憶能力有限,因此在記憶一段時間後可以根據先進先出記憶規則“適時地”忘記舊的記憶信息。這一方面防止了系統知識庫的無限擴張,另一方面也符合並模擬了人的自然記憶規律,即人的記憶是有限的,對最近記憶的信息印象最深,這能有效避免記憶知識的沖突。