むしろ通り名表記部分を検知→削除して正規化した方がいいのかも

投稿者名: 
kokogiko

こんにちは。

東西堀川とか面白いですね!

で、出ていた例を見て別のことに気付いたのですが、

・京都市上京区西堀川通竹屋町上ル下堀川町164番地

・京都市中京区西堀川通御池下る西三坊堀川町521番地

この例どちらも、間に通り名表記が入ることによって多くのジオコーダでひっかからないのですが、逆に通り名表記をぶっこ抜いて、

・京都市上京区下堀川町164番地

・京都市中京区西三坊堀川町521番地

とすれば、大抵のジオコーダで正確に出るようです。

多くのジオコーダが、

・都道府県-郡/市区町村-町丁目-大字

みたいな構造を前提にしているから、市区町村と町丁目の間に通り名表記が入る京都住所が引っかからないのであって、通り名部分を抜いてやれば、普通にひっかかるんじゃないでしょうか。

なので、

・町丁目以下を含まない、純粋に通り名までで終わっている住所

・「中京区亀屋町」のように、通り名を含めないとどこか特定できない住所

についてのみ通り名アプローチをし、それ以外については、通り名を抜いた住所をメインジオコーダに投げて結果を得る、というアプローチにした方がよいように思います。

いかがでしょうか。

そのとおりです

情報どうもありがとうございます。
そのとおり、後ろに番地等が入っている場合、通り名を省いてジオコーダに投げれば、かなりの率でヒットします。
その他、ビル名が入っていたりするとジオコーダはアウトなので、
・京都で通り名があり番地も入っている場合は通り名を抜いてジオコーダーにバイパスする(ビル名とかも削除する)
という改造を開発中です。
できればまたNewsにアップさせていただきます。
ありがとうございました。