データ拡張(Data Augmentation)は、既存のデータに様々な変換を適用することによって、データセットのサイズを人工的に増加させる手法です。特に、データセットが小さいまたは制限されている場合にコンピュータビジョンのタスクでよく使用されます。元のデータのラベルを変更せずに、わずかに修正されたバージョンを作成することで、モデルがよりロバストになり、過学習の可能性を減らします。学習中に同じデータの変種を見ることによって、モデルはより多様なデータに対して一般化できるようになります。
画像処理におけるデータ拡張の例
- 回転: ランダムな角度で画像を回転(例えば±30度)。
- スケーリング: 拡大または縮小して異なる解像度の画像を作成。
- 反転: 画像を水平に反転。
- 色調整: 明るさ、コントラストを変更したり、ノイズを加えたりして、照明の変化に対してモデルが頑健になるようにする。