テクノロジ系 / データベース
データクレンジング
データクレンジングは、データの誤りや重複、表記の揺れを直して品質を高める作業です。
もう少し詳しく
複数の源から集めたデータには、誤入力、欠損、重複、表記の不統一などが含まれがちです。これらを修正・統一・除去して、分析や活用に使える正確なデータに整えます。質の低いデータのまま分析すると誤った結論を招くため、活用の前提となる重要な作業です。
試験での見方
例:「(株)」と「株式会社」の表記を統一し、重複した顧客データを除きます。
テクノロジ系 / データベース
データクレンジングは、データの誤りや重複、表記の揺れを直して品質を高める作業です。
複数の源から集めたデータには、誤入力、欠損、重複、表記の不統一などが含まれがちです。これらを修正・統一・除去して、分析や活用に使える正確なデータに整えます。質の低いデータのまま分析すると誤った結論を招くため、活用の前提となる重要な作業です。
例:「(株)」と「株式会社」の表記を統一し、重複した顧客データを除きます。
データの誤り・重複・表記揺れを整える作業である点が問われます。データ統合や分析の前提となる点を押さえましょう。