- 相關(guān)推薦
關(guān)于漢語(yǔ)拼音分隔符規(guī)則
漢語(yǔ)拼音是小學(xué)語(yǔ)文教學(xué)的一個(gè)重要組成部分,是幫助學(xué)生識(shí)字、閱讀、學(xué)好普通話的工具。要進(jìn)一步提高漢語(yǔ)拼音教學(xué)效率,讓學(xué)生在輕松、快樂的環(huán)境中學(xué)好拼音,就要激發(fā)學(xué)生學(xué)習(xí)興趣,教給學(xué)習(xí)方法,活躍思維、靈活運(yùn)用。以下是小編整理的漢語(yǔ)拼音分隔符規(guī)則,歡迎閱讀。
遠(yuǎn)久時(shí)代,拼音分割是靠人手動(dòng)輸入分隔符實(shí)現(xiàn)的,比如輸入最常用的單引號(hào)來(lái)分割,但實(shí)際使用時(shí)要求輸入分隔符非常不人性化,現(xiàn)在基本上都是連續(xù)輸入拼音字母,由程序自動(dòng)判斷分割。如輸入dandingpinyin將被自動(dòng)分割成dandingpinyin,單引號(hào)是不用輸入的
●拼音分割初版
為了正確分割,首先得知道什么是正確的拼音,有了正確的拼音組合之后就能做最最基本的分割了。為此搜尋了幾番,雖然網(wǎng)上有教師羅列教學(xué)用的拼音組合,但最終這個(gè)事情還是自己做了,網(wǎng)絡(luò)就是這么回事,拿東西易,要好東西難。實(shí)際上有了足夠的拼音詞庫(kù)的話,把全部單字拼音都拿出來(lái)再去除重復(fù)就行了,當(dāng)然為了簡(jiǎn)拼,單個(gè)字母也是要的。
map("pin") = True
map("qin") = True
map("cou") = True
map("dou") = True
map("zhui") = True
map("nou") = True
map("b") = True
……
…… 查看這個(gè)組合,最長(zhǎng)的單字拼音是6個(gè)字母,如zhuang,因此,簡(jiǎn)單的初級(jí)算法也就有了:從6到1,依次截取左邊字母判斷,如果在拼音組合集里有,那就作為一個(gè)單字拼音分割,注意到也可能手動(dòng)輸入了分隔符,自然是要先按存在的分隔符分割了。這樣,初版分割也就完成。
●拼音分割自動(dòng)除錯(cuò)版
初版使用下來(lái),不足之處還是不少,最不該的是正確的拼音輸入被誤分割成錯(cuò)誤的拼音。比如:輸入yinguquexi本想得到y(tǒng)inguquexi(因故缺席),卻被魯莽的分割成yinguquexi導(dǎo)致錯(cuò)誤。
這是無(wú)法忍受的使用體驗(yàn),淡定的解決辦法是打硬仗,yingu就應(yīng)該分割成yingu,cangu就應(yīng)該分割成cangu,zhani應(yīng)該是zhani,zhanv應(yīng)該是zhanv,如此等等,全部手工組合判斷后硬編碼為必須如此分割,終于,錯(cuò)誤分割的情況不再有了。 mapCustBreakPy("ani") = "a"
mapCustBreakPy("anu") = "a"
mapCustBreakPy("anv") = "a"
mapCustBreakPy("angu") = "an"
mapCustBreakPy("eni") = "e"
mapCustBreakPy("enu") = "e"
mapCustBreakPy("env") = "e"
mapCustBreakPy("engu") = "en"
……
……
……
●拼音分割智能版
在拼音輸入的過程中,還有種模棱兩可的情況,比如:輸入qinang想得到qinang(氣囊),不料卻被分割成qinang,屢屢發(fā)生這種情況需要手動(dòng)輸入分隔符修正,這也是種非常爛的輸入體驗(yàn)。
兩個(gè)都是正確的單字拼音,程序怎么知道哪個(gè)是是你要的呢?只能是告訴它了。也許有已實(shí)現(xiàn)的很好的算法存在,但我不知道,有了除錯(cuò)版經(jīng)歷,自然是做法沿用,愚公移山,以簡(jiǎn)馭繁,約1千多種類似組合,全部用輸入法試算后人工判斷應(yīng)該如何分割更好,然后硬編碼告訴程序按我說的做。完成后相比之下智能版效果確實(shí)不同凡響。 mapCustBreakPy("yingai") = "yin"
mapCustBreakPy("yingao") = "yin"
mapCustBreakPy("yingei") = "yin"
mapCustBreakPy("jingao") = "jin"
mapCustBreakPy("jingan") = "jin"
……
……
……
●拼音分割增強(qiáng)版
智能版所達(dá)到的智能效果是建立在人工判斷的基礎(chǔ)上,在人工判斷的過程中,會(huì)出現(xiàn)一種“兩全其美”的情況,就是這么分是好的那么分也很不錯(cuò),人都為難更何況程序呢。比如:nana到底是nana(娜娜)還是nana(難。,yingan應(yīng)該是yingan(陰暗)還是yingan(陰干),更有xian是單字(先)好還是xian(西安)好呢,拿捏不定,只能按正常處理不去分割了。
但為了有更好的輸入體驗(yàn),兩全其美的事情還是要做一下,思來(lái)想去選了一個(gè)折中之計(jì),比如輸入xian,雖然不做分割,但又非要顯示“西安”,這時(shí)就把“西安”兩個(gè)字當(dāng)一個(gè)漢字用,定義“西安”的拼音為xian,如此應(yīng)付一翻,結(jié)果還不賴。當(dāng)然這終究不是完美之策,還是可以有辦法自動(dòng)的更智能的增強(qiáng)的,閑時(shí)再議了。
【漢語(yǔ)拼音分隔符規(guī)則】相關(guān)文章:
什么是漢語(yǔ)拼音規(guī)則01-30
漢語(yǔ)拼音大寫的規(guī)則03-17
漢語(yǔ)拼音的書寫規(guī)則09-27
漢語(yǔ)拼音規(guī)則口訣03-18
漢語(yǔ)拼音注音規(guī)則07-04
漢語(yǔ)拼音讀寫規(guī)則09-29