9/16(Mon)
2023年11月21日 10:55 更新
データベースとはデータを管理するための入れ物のことで、顧客情報や経営情報などさまざまなデータを効率的に保管したり呼び出したりすることができます。そのため、企業をはじめ多くの組織・個人に利用されています。本稿ではデータベースの意味や仕組みを誰にでも分かりやすいように解説していきます。
データベースの意味を理解し基礎知識を身につけたい人や、ITリテラシーを強化したいと考える人は是非ご覧ください。
データベース(Database)とは直訳すると「データの基地」であり、言葉の通り顧客情報や経営情報など何らかのデータを一か所に集約して格納しておく入れ物のことです。
また、これらのデータは何かしらのルールを持って整理・格納されているため、利用者は大量のデータから欲しい情報を検索したり利用したりできます。
広義では「特定の目的で集約されたデータの集合体」として紙で書いた情報をまとめておくファイルなども当てはまりますが、近年ではコンピューターの中で作成・保存し、ソフトウェアで管理されているもののことを指すことが一般的です。また、データベースは省略してDBと言うこともあります。
※参照:Schooオリジナル授業『データベース概論 -1回目-』
普段生活の中で「データベース」という言葉をあまり耳にしないという方も多いと思われますが、実は私たちの周りにはさまざまなデータベースが存在しています。
具体的な例としては、googleなどの検索エンジン、図書館の書籍の貸出システム、店舗の在庫管理システム、顧客情報の管理システムや電子カルテなどがあります。これらに共通しているのは、どれも特定の情報(データ)が整理の上格納され、必要に応じて情報を登録・削除・検索することが可能であるという点です。
普段、Excelなどの表計算ソフトに何らかの情報を集約し、データを管理することに利用しているという方も多いのではないでしょうか。Excelには集計機能や並び替え機能・フィルター機能などが備わっているため、データベースとして利用することも出来ますが、表計算ソフトとデータベースは同じものではありません。
前提として、表計算ソフトは主に計算をするために作られたソフトウェアです。データベースとしての利用を主目的にしていないため、容量の上限の観点から大量のデータ管理には向いていません。また、表計算ソフトは入力形式も自由がきく分、データの一貫性を保ちながら複数人で共同利用するのが難しい側面もあります。
そのため、大量のデータを集約・管理する場合はデータベースの専用ソフトを利用することがおすすめです。
ここまではデータベースとは何かについて説明するとともに、その具体的な例と表計算ソフトとの違いについて詳しく解説してきました。以降ではSchooオリジナル授業『データベースを知る -データを有効活用するために』を元に、データベースの重要性や利用のメリットについて解説していきます。
データベースを用いる大きなメリットの一つは、データを一元管理できるようになることです。データの一元管理とは、さまざまなデータを一箇所に集め、統一された方法で管理することを指します。
例えば小売店で会員情報を店舗ごとに管理(=多元管理)していた場合、顧客から住所変更の申し出があっても受け付けた店舗における情報しか書き換わらないのであれば、顧客は店舗毎に手続きが必要になりとても不便です。また、店舗間で情報が共有されるとしても、店別に同じ書き換え作業を行うのは無駄が多く、ミスも誘発されやすいでしょう。
データを一元管理すると、このような多元管理のデメリットを克服し、無駄のない効率的な管理ができるようになります。
データベースでデータをまとめて管理すれば、仮に複数部署や複数人でデータを利用してもデータの整合性が維持され、矛盾が生じません。
例えば、営業部と経理部で各々取引先データを管理していた場合、いずれかの部署でデータの更新漏れが発生すればデータの整合性が取れなくなってしまいます。また、営業部では取引先別の売上金額がリアルタイムで更新されるのに、経理部では営業部門の報告書を待ってから更新するという状況では、データを参照するタイミングによって数字に食い違いが起きることなどもあるでしょう。
このように、データがバラバラに管理されていると矛盾やデータの食い違いが生じやすくなります。一方、データベースにまとめて管理すればどの部署・部門にいても矛盾なく同じ情報を参照することができるのです。
前提としてデータベースは大量のデータを保存し、使いたい時にすぐに抽出したり、整合性を保ったまま編集したりするために存在しています。そのため、基本的にデータベースには、これらのデータマネジメントを効率的に行うための機能が備わっています。
これにより、目視ではとても確認できない数百万・数千万行といった膨大なデータから瞬時に該当データを抽出したり、保管が不要になったデータを抜け漏れなく削除することができるのです。
DX化が進む昨今のビジネスシーンにおいて、顧客情報や経営情報といったデータは非常に重要な役割を担っています。そのため企業は、それらのデータを消失するリスクに備え、安全に維持していくことが求められます。こういった背景から、耐障害性はデータベースに求められる重要な要素の一つとなっています。
例えばデータ消失はユーザーの操作ミスやシステム不具合、自然災害のような非常事態により起きる可能性があります。データベースによって機能は異なるものの、こういったリスクに対してデータのバックアップやリカバリー機能などが提供されていることが多いです。
前述したようにデータは企業の大切な資産であり、万が一流出させてしまった場合は社会的な信用を失うなど大きな問題になる可能性も高いです。
具体的なセキュリティ課題としては、ウイルスやハッキングなどによる外部攻撃に加え、社内ユーザーによる誤送信や誤操作、または社内ユーザーが意図的に情報を持ち出すことなどがあり、企業はさまざまなリスクに備える必要があります。
データベースではそれらのセキュリティ課題に対し、例えばデータを暗号化したり、ユーザー別にデータへのアクセス可能範囲を制御したり、またはデータ利用のログを収集する機能を持つなどで対策を講じられるようになっています。
ここまでデータベースは、①特定のルールの元に整理されたデータの集合体であり、②利用者はそこからデータを利活用できることを説明してきました。ここからは、それを実現する仕組みについて解説します。
上の図は、データベースの仕組みを表したものです。データベースに格納された各種データは、それらデータを管理するためのシステムで操作することができます。この管理システムのことをDBMS(データベース管理システム)と言います。
ユーザーは、このDBMSに命令を行うことで、データの登録・検索・削除を行います。DBMSを操作するには専用の言語(データベース言語)が用いられ、この言語の代表的なものがSQLです。
DBMS(データベース管理システム)とは、その名の通りデータベースを管理するためのシステムです。通常、データベースとDBMSはセットで考えられるため、両者を一まとめに「データベース」と呼ぶことも多いです。
DBMSの基本機能は、データの格納や定義・データの操作(検索/更新/削除)・アクセス制御などです。
またDBMSにはさまざまな種類があり、オープンソースとして無料で提供されているものと各企業が商品として提供しているものがあります。オープンソースで有名なものにはMySQLやPostgreSQLなどが、企業が提供しているものにはOracle Databese、Db2、Microsoft SQL Serverなどがあります。
他にもさまざまな企業からDBMSが開発・提供されていますが、商品によってサポートや機能は異なるため、導入コストや利用用途、規模やセキュリティ面などを考慮の上で選択します。
SQL(エスキューエル/シークェル)とは、データベースを操作するためのコンピュータ言語である「データベース言語」の一種で、データベースに格納するデータを定義したり、格納したデータにアクセスしたりするために使われます。
SQLの特徴は、ISO(国際標準化機構)で標準化されており多くのデータベースで共通して利用できることと、それにより大きなシェアを誇ることです。また、構文が比較的シンプルであることから、非エンジニアにも利用ができ、ビジネスの現場でも頻繁に使用されています。
※※Schooコラム『SQLとは何か?基礎知識や重要性を分かりやすく解説 』ではSQLについてさらに詳しく解説しています。興味のある方は是非ご覧ください。
データベース(DBMS)には、データを保持する形式によって複数の種類があります。ここからは、データベースの主な種類として以下の6つについて詳しくご紹介していきます。
階層型データベースとは、上の画像のようにツリー状にデータを保存していく方法です。1960年頃から使用されており、データベースの歴史の中で最も初期から存在する形式でもあります。
このデータベースはデータの親子関係が明確であり、構造が固定されているという特徴があります。そのためデータを検索する場合には、親データ(親ノード)から子データ(子ノード)へと、あらかじめ定義されたルートを辿ってデータを参照していきます。
構造が比較的シンプルなデータの管理には向いている一方で、例えば特定の子データを複数の親データに紐付けることはできないなど、構造が固定化されているため、何か変更を加える場合には大きな改修が必要になることもあります。
ネットワーク型データベースでは、データ同士が網の目のような構造を持っています。上図で示しているように、子に対して複数の親データを紐づけることが可能であり、そこが階層型データベースと大きく異なります。これにより、重複したデータ登録を避けることなどができます。
一方で、利用にあたってはデータ構造を理解していないと希望するデータにアクセスできないことや、構造を変更する難易度が高い点は、階層型データベースと変わりません。
リレーショナル型データベース(RDB)とは、上の画像のように行と列が組み合わさったテーブル形式でデータを管理するデータベースです。現状最も普及している管理方式であり、一般的に「データべース」と言えばこの型を指すことが多いです。
リレーショナル型データベースでは、データを複数のテーブルに格納し、各々のデータを「キー」と呼ばれる共通データを使って突合します。例えば上の画像では、顧客番号がキーになります。そのため、階層型・ネットワーク型のように親と子の形になるようにデータを構成する必要がなく、柔軟なデータの取り扱いが可能です。
データの操作にはRDBMSというRDB専用のデータベース管理システムを用います。また上でご紹介したSQLは、このRDBを操作することを目的に開発された言語です。
オブジェクト指向型データベース(OODB)とは、データを階層やテーブルではなく、「オブジェクト形式」で格納するデータベースのことです。
データをオブジェクトとして格納するため、データ定義に用いたJava・Smalltalk・C++などのオブジェクト指向言語を使って直接データベースを操作することが可能です。RDBと比べて複雑なデータを高速で扱え、また音声や動画などさまざまなタイプのデータを扱うことが可能な点が特徴です。
一方、OODBは特定のプログラミング言語で定義するためそれ以外の言語と柔軟に連携することが難しい点や、開発難易度が高くRDBに比べると普及していないため、サポートが受けにくいという欠点があります。
XML型データベース(XML-DB)とは、データをXML(Extensible Markup Language)形式で管理するデータベースです。XMLとはHTMLと同じ「マークアップ言語」の一種であり、上画像の赤枠内のように、タグを利用して情報を構造的に記述するために用いられます。
XMLの記述形式は世界標準規格であるため、電子商取引分野やドキュメントの管理など、さまざまなシーンで使われています。そのためXML-DBは、データをXML形式のまま格納できるという点で利便性が高いと言えます。
一方、定型で大量のデータを処理するのはRDBの方が得意な領域であるため、管理したいデータの種類や運用によってどちらが適しているかは変わってきます。
※画像はSchooオリジナル授業『データベース概論 -1回目-』より引用
NoSQL(非リレーショナルデータベース)とは特定の機能や型を指すものではなく、RDB以外のデータベースのことを総称する言葉です。
NoSQLはRDBでは対応しにくい、ビッグデータなどの膨大かつ多様なデータを管理する目的で生み出されました。NoSQLの魅力は、SQLを必要とせず大量のデータを高速で処理できる点に加え、音声や動画などのさまざまなデータを扱うことができる点にあります。
上記のようなメリットがある一方、NoSQLは扱えるデータ形式が多様な分RDBと比べて複雑なデータ抽出が行いにくいことや、処理スピードを重視するためデータの一貫性が担保されないなどの側面があります。
このことから、NoSQLはRDBとは得意分野が異なり、シーンに応じて使い分けが必要なものであると言えるでしょう。
ここまでデータベースにはさまざまな種類があることを確認してきました。中でも現在ではリレーショナルデータベースが主流であるとお伝えしましたが、ここではそこに至るデータベースの歴史とその変遷・進化についてもご紹介していきます。
データベースの起源は、コンピューターの登場により大量のデータを管理する専用ソフトウェアが必要とされたことにあります。1960年代前半に初めて商品化されたデータベースが登場しました。
この当時は主に階層型データベースが使われていましたが、この形式は上でも述べた通り構造の柔軟性が低く多様なデータを管理することが難しいものでした。また、専門的なエンジニアでないと取り扱うことが難しく、メンテナンスが困難であるという課題もありました。
その後1970年になると、階層型データベースの欠点である柔軟性の低さや扱いにくさを解消できるリレーショナルデータベースが、計算機科学者のE.F.コッドによって開発されました。
コッドの発明が画期的だったのは、データを階層構造ではなく二次元表(テーブル形式)で管理することでメンテナンスの柔軟性を高め、高速にデータを扱えるようにしたことです。
また、時を同じくしてRDBを操作するための言語であるSQLも開発され、優れた操作性から各所で広く使われるようになりました。
RDBはその汎用性の高さから現在においてもデータベースの主流となっていますが、社会のデジタル化によって取り扱うデータの種類や量が急増し、RDBでのデータ管理が適さないシーンも増えてきました。
例えばビッグデータなど大量かつ多様なデータを取り扱うシーンにおいては、拡張性や取り扱えるデータの種類が豊富であることが大切です。しかしRDBはデータベースを複数のサーバーに分散して格納することが原則的に難しいため拡張性に乏しく、画像や音声といったテキスト外のデータを取り扱うのも苦手です。
そのためRDBでは対応が難しいシーンに適したデータベースとして、NoSQLが注目を集めるようになったのです。
最後に、データベースやその周辺知識をさらに深められる、Schooオリジナル授業をご紹介します。URLから授業詳細を確認いただけるので、気になる方はぜひ覗いてみてくださいね。
< コース紹介 >
この授業は、データベースについての基礎知識を学べる授業です。講師の先生は資格スクールでITの基礎から応用まで幅広く教えており、知識や経験が豊富なので初学者の方でも理解しやすい授業となっています。授業では図を用いて分かりやすく説明されてるので、データベースについて学びたいと考える方はまずこちらをご覧ください。
先生プロフィール
三村 かよこ(みむら かよこ)
中堅資格スクールにてOA講師として約1,000名の受講者に対してIT基礎からCADまで多くの講義を登壇。その後IT企業にインフラエンジニアとして転職。 ネットワーク構築、サーバー管理・運用、DBのパフォーマンスチューニング、仮想化、マイグレーション対応等を多く経験。現在はフルネスにてIT講師として従事。自身の経験を通じて感じたことを中心に、現場で起きるトラブル等も盛り込んだリアリティ感ある研修を提供。
< コース紹介 >
この授業では、エンジニアでテクノロジー教育家の山浦先生に、誰もが知っておくべきIT用語とその仕組みを教えていただきます。特に、DXの推進でネットワークや情報技術に関わる用語や概念について学ばなくてはいけないことが増えてきた非エンジニアや、普段ITにあまり関わりのない業務に携わる人におすすめの授業です。
先生プロフィール
山浦 清透(やまうら きよと)
エンジニア/テクノロジー教育家。株式会社ユーブル代表取締役。Web系企業にてエンジニア・プロダクトマネージャーを経て2019年独立。テクノロジーを身に付けたい人が「できる」になるをコンセプトに、プロのエンジニアの養成スクールを運営している。プログラミング系YouTube登録者数7万人。Udemy受講者数10万人。
< 授業紹介 >
この授業は、本稿でもご紹介したデータベース言語「SQL」を扱うために必要なデータベースに関する知識と関数を用いたデータ操作について実践的に学べるコース授業です。データベースに関する知識の中でも、特にSQLを学びたいと考える方におすすめです。
先生プロフィール
岡田 賢治(おかだ けんじ)
UNIX/Linuxのシステム管理者歴、30年。専門学校で非常勤講師10年。執筆した書籍多数。 プログラミング開発・DB設計・AWS・Azure・Office365等々、一通りのことはやっています。
< コース紹介 >
この授業では、ITに関する基礎的な知識が証明できる国家資格であるITパスポートの試験に合格するために必要な基礎知識を学んでいきます。全10回の授業ではデータベースだけでなく、セキュリティやネットワークなどITに関するさまざまな知識を学ぶことができます。データベースをはじめとするITの知識を習得し、資格取得や実務に役立てていきたいと考える方は是非ご覧ください。
先生プロフィール
石田 宏実(いしだ ひろみ)
デジタルプランニング株式会社 代表。udemy講師(開講から1年で受講者18,000人、延数25,000人)。応用情報技術者試験、データベーススペシャリスト試験合格。著書に「ゲーミフィケーション」(大和出版)。8年間のサラリーマンプログラマを経て、デジタルプランニング株式会社設立。ネット集客の知識はもちろん、ネットを使わないいわゆる「リアル」集客も得意とする。
本稿では、常日頃から多くの場面で利用しているデータベースの意味や仕組み、種類とその変遷などについて詳しく解説してきました。近年は特にDX化なども進み、企業でもデータベースをはじめとするITの知識を学んだり、自在に活用したりすることが求められています。
SchooではデータベースやSQL、DXに関する学習コンテンツが月額980円で受け放題です。毎日無料の生放送もやっているので、是非覗きにきてくださいね。