Home2008年07月 ≫ 数字の読みについて

2008 07/16 (水) 15:57

漢字→ひらがなの変換を他のAPIに依存してたんだが、
困った部分が・・・それは「数字」。

理想は、
・1月→「いちがつ」
・2008/01/01→「にせんはちねん いちがつ いちにち」
・〒904-2172→「きゅーぜろよん の にーいちななにー」
な感じだ。
しかし、MeCabやYahooAPIとかはうまく変換してくれないorz
APIに文字列投げる前に、自前変換tableで置換する必要がありそうだ。

数字に関しての読み上げ規則でめちゃ参考になったサイト。
≫アクセシビリティ豆知識-「数字」について:PoP-mix
http://www.pop-mix.jp/accessibility/acc06.html

↑を参考にpreg_match_all()とか、正規表現で数字部分を抜き出し、
通常読みさせるか、単数読みさせるかを選んで、
ひらがな等に変換しておくのが必要かもしれない・・・難儀だぁ~orz
てゆか、その前に、
通常読み:123を「ひゃくにじゅうさん」って変換するのが1番難しいぞ。

100→「ひゃく」
200→「にひゃく」
300→「さんびゃく
400→「よんひゃく」
500→「ごひゃく」
600→「ろっぴゃく

この規則は何なんだ!!!日本人ながら日本語で苦しんでるしw
・・・誰かイイ置換・変換方法教えてくれぇ。

【追記】参考:
[PDF] http://www.yonago-city.jp/guideline/howtoreadout.pdf

Comments

おおお、
数字を漢字(5→五)に変換してAPI通すとうまくいくっぽい裏技・・・。全てが大丈夫か不安だけど;

by:YO (2008年07月16日 16:58)

http://jlp.yahooapis.jp/JIMService/V1/conversion?appid=YahooDemo&sentence=0123456789

数字の変換はこっち使ったほうが安全っぽいな。

by:YO (2008年07月16日 17:26)

PS2はプレステツー
Googleはグーグル

by:INO (2008年07月17日 16:33)

なかなかうまく動いてるんじゃない?
変換チューニングはそろそろ終わりにして・・・
メインflashを作り始めます。

by:YO (2008年07月21日 11:18)

Comment form










 

Track back

この記事のトラックバックURL:
http://www.wauke.net/cgi/mt/mt-tb.cgi/801

Search

RSS feed

Category

Archives

Recent TrackBacks

Recent Comments