デジタル庁による機械可読性ルールのコード化
デジタル庁は、未来のデジタル社会の形成に向け、行政データの機械可読性向上を目指す取り組みを進めています。この取り組みは、令和8年(2026年)3月31日に開催された各省庁のDX推進連絡会議において決定された「行政データにおける機械可読性に関するルール」の策定に基づいています。このルールは、データと根拠に基づく政策形成を支えるため、データの質を高める重要なガイドラインとなります。
機械可読性の重要性
AIやデジタル技術の発展に伴い、データは経済成長や社会課題解決の基盤となりました。特に、自治体や国が公開する行政データは、多くの利用者がいるため、その質の向上は社会全体に多大な影響を与えることが予想されます。従来のデータは、紙媒体での利用を前提としたフォーマットが多く、分析を行う際には多くの手間を要していました。機械可読性のあるデータを提供することにより、利用者の負担を軽減し、データの再利用を促進することができます。
ルールの枠組み
「機械可読性に関するルール」は、各府省の担当者が徐々に取り組めるように、機械可読性を3つの品質レベルに分類しています。これにより、成果の段階的な向上を図ることが可能となります。具体的には、以下のようにレベルが設定されています。
- - レベル1: 最低限の機械が読み取れる状態を確保する基本ルール
- - レベル2: 集計や分析が可能な形に整えている
- - レベル3: 他のデータとの連携や自動化が実現可能な高度な形
各レベルには、具体的なルールが制定され、実際の運用において役立てられています。例えば、ExcelやCSV形式でのデータ提供や、データの項目名を省略しないこと、時間軸の表記の標準化などがあります。これらのルールは、データの利用をより円滑にし、エビデンスに基づいた政策形成(EBPM)の推進にも寄与しています。
データクレンジングの重要性
行政データを機械可読性の高い形式に整えることは、情報の透明性を高めるだけでなく、転記ミス等の問題を減少させます。また、ビジネスインテリジェンス(BI)ツールを使ったデータ分析の促進や、AIを活用した高度な分析手法の導入にもつながります。これは、社会全体におけるコストの削減につながるため、重要な取り組みと言えるでしょう。
ルールの提供と利用
デジタル庁は、これらのルールと機械可読な形式のデータファイル(CSVとJSON)を提供しています。この情報は、行政機関だけでなく、民間企業や研究者など、広範囲にわたる関係者が利用可能です。このようにデータの機械可読性を向上させることで、より多くの人々が行政データを活用し、社会の各層で新たな知見が生まれることが期待されています。
最後に
デジタル庁の取り組みによって、行政データの機械可読性が改善されることで、今後、よりデジタル化が進み、官民問わずデータを利用した新たな価値創造が促進されることが期待されます。データの質を向上させるこの取り組みが、デジタル社会の基盤となることを願っています。