今日は情報のR3第8問について解説します。
意思決定や計画立案のために、データを収集して加工・分析することがますます重要になってきている。以下の文章の空欄A~Dに入る語句の組み合わせとして、最も適切なものを下記の解答群から選べ。
意思決定や計画立案のために、組織内で運用される情報システムやデータベースなどからデータを集めて格納しておく場所を[ A ]と呼ぶ。この[ A ]から、必要なものだけを利用しやすい形式で格納したデータベースを[ B ]と呼ぶ。
このような構造化されたデータに加えて、IoT 機器やSNS などからの構造化されていないデータを、そのままの形式で格納しておく[ C ]が利用されつつある。膨大なデータを蓄積する必要があるため、比較的安価なパブリッククラウドのオブジェクトストレージに格納される場合が多い。
収集されたデータの品質を高めるためには、データ形式の標準化や[ D ]が重要である。
〔解答群〕
ア A:データウェアハウス B:データマート
C:データレイク D:データクレンジング
イ A:データウェアハウス B:データレイク
C:データスワンプ D:データクレンジング
ウ A:データマート B:データウェアハウス
C:データプール D:データマイグレーション
エ A:データマート B:リレーショナルデータベース
C:データレイク D:データマイグレーション
オ A:データレイク B:データマート
C:データプール D:データマイニング
解説
データベース(データ分析)に関する問題です。
それでは早速、それぞれの空欄を見ていきましょう。
空欄A:データウェアハウスは、データの倉庫という意味で、倉庫のように会計システムや発注システムといった社内の様々な基幹業務ソフトのデータを時系列に集積して一元管理するものである。
よって、[ A ]には「データウェアハウス」が入ります。
空欄B:データマートは、英語でデータのお店を表し、データウェアハウスから必要なデータを抽出し利用目的や利用ユーザを限定して使えるようにしたデータベースです。
よって、[ B ]には「データマート」が入ります。
空欄C:データレイクは、ビッグデータをそのまま(生データのまま)格納できるストレージリポジトリのことである。特に、音声や動画、SNSのログなどを含むあらゆる形式のデータ(非構造化データ)を、そのままの形式で貯めておけるのが利点である。
よって、[ C ]には「データレイク」が入ります。
空欄D:データクレンジングとは、データベースなどに保存されているデータの中から、重複や誤記、表記の揺れなどを探し出し、削除や修正、正規化などを行ってデータの品質を高めることである。データマイグレーションとは、異なる種類の装置やソフトウェア、システム、データ形式などの間でデータを移すことである。データマイニングとは、大容量のデータを解析することで隠された法則や関係性を探す手法である。「マイニング」(mining)とは「採掘」の意味で、鉱石を掘り出すことに例えられる。
よって、[ D ]には「データクレンジング」が入ります。
以上から、正解は選択肢アとなります。