一都民にして一JavaScripterにして一正規表現者として書かずにいられませんでした。

以下、お試し用。

  1. 東京都庁
  2. JR東日本東京駅
  3. 東京タワー
  4. 東京電波塔
  5. 江戸東京博物館
  6. 東京都
  7. 東京都中央区
  8. 東京都江戸川区
  9. 東京電力
  10. 東京特許許可局
  11. 三菱東京UFJ銀行
  12. 三菱東京三和銀行
  13. 東京オリンピック
  14. 東京五輪
  15. 東京マラソン
  16. 東京摩羅村
  17. 東京武技鵜議
  18. 東京だよおっ母さん
  19. 東京ラブストーリー
  20. 東京失恋物語
  21. 東京ディズニーランド
  22. 東京鼠地帯

「非首都ディズニーランド千葉」にならないじゃないかというお叱りを受けそうですが、したらしたらで今度は東京都が最強でなくて埼京になりそうなのでやめておきました。

Source:

(function(e){
  e.innerHTML = e.innerHTML.replace(
    /東京都?([\u3200-\u4DBF\u4E00-\u9FFF\uF900-\uFAFF]+)/g, 
    '首都$1東京'
  )
})(document.body)

漢字を判定する正規表現が工夫のしどころでしょうか。[一-龠]はUnicode時代にはちょっと古い。grep CJK /usr/local/lib/perl5/5.10.0/unicore/Blocks.txtが参考資料代わりです。CJK Unified Ideographだけ欲しければ[\u4E00-\u9FFF]でも行けます。

首都民東京な方もそうでないかたもご自由にお使い下さい。

弾the首都ブロガー東京