本文へスキップ

テクノロジ系 / データベース

データクレンジング

データクレンジングは、データの誤りや重複、表記の揺れを直して品質を高める作業です。

もう少し詳しく

複数の源から集めたデータには、誤入力、欠損、重複、表記の不統一などが含まれがちです。これらを修正・統一・除去して、分析や活用に使える正確なデータに整えます。質の低いデータのまま分析すると誤った結論を招くため、活用の前提となる重要な作業です。

試験での見方

黒猫の闇の刻印

データの誤り・重複・表記揺れを整える作業である点が問われます。データ統合や分析の前提となる点を押さえましょう。

例:「(株)」と「株式会社」の表記を統一し、重複した顧客データを除きます。

分類

テクノロジ系 / 技術要素 / データベース

小分類:データベース応用

関連トピック:データベースの応用

情報の根拠

IPA FEシラバス Ver.9.2 の用語例をもとに、試験対策向けに独自解説しています。

関連用語

データベースの用語一覧へ