発音記号を表示する

 発音記号を画面に表示してみたいと思い、いろいろ探してみた*1
 
 強弱アクセントの付け方に悩んだが、解決した。次のようになる(charsetがUTF-8でない場合や表示フォント、ブラウザによっては正しく表示されないので注意)。

 ちなみに、下表の一番上の行、CMU表記「AA」の発音記号は「a」となっているが、これは、「あ」と「お」を足したような、音のことである(「hot」など)。

CMU表記 発音記号 HTML表記
AA a á à a á à
AE æ ǽ æ̀ æ ǽ æ̀
AH ə ʌ́ ʌ̀ ə ʌ́ ʌ̀
AO ɔ: ɔ́: ɔ̀: ɔ: ɔ́: ɔ̀:
AW áʊ àʊ aʊ áʊ àʊ
AY ai ái ài ai ái ài
B b b
CH ʧ ʧ
D d d
DH ð ð
EH e é è e é è
ER ɚ ɚ́: ɚ̀: ɚ ɚ́: ɚ̀:
EY ei éi èi ei éi èi
F f f
G g g
HH h h
IH i í ì i í ì
IY i: í: ì: i: í: ì:
JH ʤ ʤ
K k k
L l l
M m m
N n n
NG ŋ ŋ
OW óʊ òʊ oʊ óʊ òʊ
OY ɔi ɔ́i ɔ̀i ɔi ɔ́i ɔ̀i
P p p
R r r
S s s
SH ʃ ʃ
T t t
TH θ θ
UH ʊ ʊ́ ʊ̀ ʊ ʊ́ ʊ̀
UW u: ú: ù: u: ú: ù:
V v v
W w w
Y j j
Z z z
ZH ʒ ʒ
 
 強弱のアクセントだが、

  1. 強アクセント、弱アクセントがついているフォントが用意されている
  2. 強アクセントのみ用意されている
  3. どちらも用意されていない

の3パターンに分けられる。初め、これらの不足している箇所をペンディングとして、とりあえず表示できるものをまとめていた。
 今日見つけたのは、まさに強・弱アクセントのみのフォント(強:「́」、弱「̀」だ。これらは、一つ前のフォントにアクセントを付ける効果がある。
 これ以前のアクセント対象フォントもこの「後付けアクセント」で表現できると思われる。プログラムで表現する場合はこちらの方が都合がいいかもしれない。上記の表で言うと、「a」や「e」に付くものが相当する。
 しかし、アクセントが付くと音を伸ばすものもあるようである(ERなど)。まぁこれらのマッチングをハッシュに入れておくようにすれば、後付けアクセントで統一する必要もあるまい。
 また、このCMU表記を使って発音を表現する場合、アクセントの有無とその強弱を次のような数字で表す。

  • 強アクセント:1
  • 弱アクセント:2
  • アクセントなし:0

 前述の「hot」ならば、「HH AA1 T」と表記される。