地方厚生局のホームページでは、管轄内の医療機関や薬局のデータをExcel形式で無料公開しています。しかし、これをダウンロードしてすぐに営業リストやCRM(顧客管理システム)へ取り込めるわけではありません。
なぜなら、これらのデータはあくまで「国民への情報開示」を目的としており、民間企業がシステムで自動処理するための構造になっていないからです。
実際にダウンロードしたデータをExcelで開くと、ビジネス利用やシステム連携を行う上で以下のような課題に直面します。
1つの病院に対して、標榜している診療科目や取得している施設基準の数だけ行が分かれており、データが複数行にまたがって出力されます。この非平坦な構造のままでは、Excelでの並び替えや重複排除ができず、DMの宛名ラベル作成等にも支障をきたします。
行政への届出は各医療機関の手書き等に基づいているケースがあり、「医療法人社団」と「(医)社」などの表記揺れが散見されます。また、1つのセル内に異なる属性(例:電話番号と勤務医数など)が混在していることもあり、これらを抽出するためには複雑な文字列処理が必要です。
全国8つの地方厚生局でファイルの仕様が統一されていません。たとえば、一部の管轄局のファイルではExcelシート内のどこにも「都道府県名」が記載されていない仕様になっており、そのまま統合すると「どこの県の施設か判別不能になる」といったデータ欠損のリスクがあります。
データをなんとか一行化・正規化できたとしても、自社のシステム(SFA/CRM)で継続運用する際にさらなる壁が立ち塞がります。
厚生局の「医療機関コード」を基準にシステム登録している企業は少なくありません。しかし、個人のクリニックが「医療法人」へ組織変更した場合、施設や院長が同じでもシステム上は旧コードが廃止され、新コードが発番されます。これをそのままCRMへ上書き(Upsert)すると、過去の営業履歴が途切れ、別顧客として二重登録されてしまいます。
医療機関のデータは毎月変動しています。全国規模で見ると、1ヶ月の間に新規開業、廃止、診療科の変更、法人成りなどが数百件単位で発生しています。毎月ダウンロードした数十個のExcelファイルを目視や手作業で突き合わせ、自社システムへ過不足なく反映(差分更新)させる作業は、担当者に重い業務負荷を強いることになります。
無料の公開データを自社でクレンジングするためには、フォーマットの違いを吸収するプログラム開発や、毎月の差分抽出といった保守作業が継続的に発生します。
社内のシステム担当者や営業事務がこの作業を担うと、見えない人件費がかさみます。さらに、厚生局側でExcelのレイアウトが予告なく変更された場合、組んでいたプログラムがエラーを起こし、改修工数が発生する懸念もあります。
自社でデータ前処理を行う手間とコストを考慮し、多くの企業が「すでにクレンジングと名寄せが完了しているデータベース」の導入を選択しています。専門のプロバイダーから、時系列での変動履歴が追跡可能なデータを定期的に受け取ることで、本来の目的であるマーケティングや営業活動にリソースを集中させることが可能になります。