画像、音声、文字などを統合的に取扱うマルチメディア処理技術は多くの要素技術(画像処理、画像合成、音声認識、音声合成、テキスト処理など)の集大成である。この演習では、特に、メディア理解において最も情報量が多く重要であるとされる画像及び映像の認識技術に関する輪読及び演習を行う。具体的には、画像からの物体抽出、3次元位置計測などを扱う。