- 更新日: 2017年03月08日
- 公開日: 2016年09月14日
オープンデータってなんなの?わかりやすく徹底解説!
オープンデータとは
「オープンデータ」という言葉を聞いたことがありますか?
これは、ものすごく単純に言えば、「公開されていて誰でも使えるデータ」のことです。
データを誰でも使えることの何が嬉しいのでしょうか?
オープンデータの意義
誰でも使えるようにすることでデータの活用が進むこと、また、データの持ち主だけでは得られない発想が期待できます。
特に、近年はマッシュアップという言葉で代表されるように、複数の異なるデータを組み合わせることで新たな発見を得る手法が注目されています。
マッシュアップされることでデータ単体の限界を超えた価値を生み出す…オープンデータという考え方は、そのような動きを加速するものといえるでしょう。
オープンデータの提供元
オープンデータを提供する動機を持つのは公共性を重んじる組織であることが多いです。つまりは国家や自治体ですね。
このような組織は公共財産であるデータを公開する義務を持っていると言えますが、常に有効な公開の仕方ができるかというと、難しいところです。
必要な情報は時代や環境で変わりますし、また新たな切り口でデータを見たい、という要望に常に応えるのはなかなか大変だからです。
そこでデータをオープンにすることで、必要な人が必要な時に加工でき、皆んなで役立てていく状況を作るわけですね。
合理的だと思います。
5つのレベル
さてオープンデータの実例を見ていきましょう…と言いたいところですが、その前に押さえておきたい考え方があります。それはオープンデータの「レベル
データは単に公開しただけでは価値がありません。加工されてこそ価値を生じます。
そう考えると、加工のしやすさはデータの価値に大きく影響を与えることになります。
このような観点でデータの扱いやすさの度合いを計るのがレベルで、5つの段階があります。
オープンなライセンス
何はともあれ公開してみた、というのがこのレベルです。加工のしやすさは考慮されていません。
このレベルに該当する代表的なデータはPDF形式の表でしょう。PDF内のデータを加工するのはとても大変で、加工するのはあきらめた方がいいでしょう。
とは言え、データが公開されているというのは大きな意味があります。
データとして扱いやすいこと
加工を考慮して、データを取り出しやすい形式で公開されているのがこのレベルです。
例のExcel形式で公開されたデータはこのレベルに該当するでしょう。
「データとして扱いやすい」というのがポイントです。例えば見栄えのためにデータを汚していると、データとして扱いにくくなります。
よく見かけるのが、単語のお尻を揃えるために字の間に空白が入っているようなケースです。
これ、本当によく見かけるのですが、加工するときだけでなく検索するときにもとても不便なので、「早く無くなって欲しい悪習の筆頭」だと私は思っています。
概して、印刷時の体裁を気にしすぎている文書はデータとして扱いにくい傾向がありますね。
オープンな形式であること(XMLやCSV、JSONなど)
CMLやCSV、あるいはJSONといった「データを表現するための形式」で公開されているのがこのレベルです。
このような形式のデータはプログラムからとても扱いやすくなります。
特に大量のデータや頻繁に変わるデータの場合、手で加工するのが難しくなるため、プログラムで加工できることの価値が高くなります。
URIが使われていること
オープンデータの標準形式であるRDFという形式で公開されているのがこのレベルです。
RDF形式でデータを表現すると、識別子としてURIが用いられるようになり、データ同士をリンクできるようになります。
単一のデータだけでなく、組み合わせて使えるようになるため、「リンクできる」という特性は大変重要です。
他のデータへリンクされていること(LOD:Linked Open Data)
RDFで表現されたデータへのリンクを含むようなデータがこのレベルです。
データ同士がリンクされていると、データ同士の関連が明確になり、誤解なく活用できるようになります。
レベルについて更に詳しい情報は5★オープンデータというページをご覧下さい。
実例
さてオープンデータの実例を見てみましょう。
データカタログサイト
は日本全国のオープンデータを集めたサイトです。総務省が運営しています。データカタログサイトは日本全国のオープンデータを集めたサイトです。総務省が運営しています。
全てのデータが集まっているわけではありませんが、かなりの数のデータがあります。お住いの地域に関するデータがないか、見てみると面白いでしょう。
このサイトで公開されているデータを使ったサービスの実例として「エレクトリカル・ジャパン」があります。
福井県鯖江市の取り組み
鯖江市は「データシティ鯖江」を掲げていて、XMLやRDFでデータを積極的に公開しています。
オープンデータを使用したアプリも多数作成されており、日本におけるオープンデータの取り組みとしては最先端と言っていいでしょう。
\Webサイト担当者としてのスキルが身に付く/
最後に
オープンデータの考え方と実例をご紹介しました。
オープンデータは加工されてこそ価値が高まります。もし貴方が開発者なら、オープンデータを使ったサービスやアプリを是非作ってみて下さい。それが誰かの役に立つかもしれません。そしてそれこそが、オープンデータの目指すところだと思います。
- この記事を書いた人
- tomo