数字の読みについて
2008
07/16
(水)
15:57
漢字→ひらがなの変換を他のAPIに依存してたんだが、
困った部分が・・・それは「数字」。
理想は、
・1月→「いちがつ」
・2008/01/01→「にせんはちねん いちがつ いちにち」
・〒904-2172→「きゅーぜろよん の にーいちななにー」
な感じだ。
しかし、MeCabやYahooAPIとかはうまく変換してくれないorz
APIに文字列投げる前に、自前変換tableで置換する必要がありそうだ。
数字に関しての読み上げ規則でめちゃ参考になったサイト。
≫アクセシビリティ豆知識-「数字」について:PoP-mix
http://www.pop-mix.jp/accessibility/acc06.html
↑を参考にpreg_match_all()とか、正規表現で数字部分を抜き出し、
通常読みさせるか、単数読みさせるかを選んで、
ひらがな等に変換しておくのが必要かもしれない・・・難儀だぁ~orz
てゆか、その前に、
通常読み:123を「ひゃくにじゅうさん」って変換するのが1番難しいぞ。
100→「ひゃく」
200→「にひゃく」
300→「さんびゃく」
400→「よんひゃく」
500→「ごひゃく」
600→「ろっぴゃく」
200→「にひゃく」
300→「さんびゃく」
400→「よんひゃく」
500→「ごひゃく」
600→「ろっぴゃく」
この規則は何なんだ!!!日本人ながら日本語で苦しんでるしw
・・・誰かイイ置換・変換方法教えてくれぇ。
【追記】参考:
[PDF] http://www.yonago-city.jp/guideline/howtoreadout.pdf
Comments
おおお、
数字を漢字(5→五)に変換してAPI通すとうまくいくっぽい裏技・・・。全てが大丈夫か不安だけど;
http://jlp.yahooapis.jp/JIMService/V1/conversion?appid=YahooDemo&sentence=0123456789
数字の変換はこっち使ったほうが安全っぽいな。
PS2はプレステツー
Googleはグーグル
なかなかうまく動いてるんじゃない?
変換チューニングはそろそろ終わりにして・・・
メインflashを作り始めます。