動画像処理ライブラリRaVioliにおけるCPUとGPUを併用した自動並列化

Info

大平 真司, 津邑 公暁, 松尾 啓志 : "動画像処理ライブラリRaVioliにおけるCPUとGPUを併用した自動並列化", 信学研報 (SWoPP2012) ,pp73--78 (Aug. 2012)

Abstract

侵入者検知などリアルタイム性が重要となるアプリケーションが盛んに開発されている.しかし,汎用OS上では,リアルタイム動画像処理に必要なCPUリソース量を確保し続けることは困難である.そこで,この問題を解決するため,我々は擬似的にリアルタイム性を保証する動画像処理ライブラリRaVioliを提案している.また,高速な動画像処理を実現するために,GPU向けに拡張したRaVioli/CUDAも提案している.このRaVioli/CUDAは,GPU上のメモリの管理や実行構成の設定などをライブラリ内に隠蔽することで,プログラマの負担を軽減している.しかし既存のRaVioli/CUDAでは,冗長なデータ転送が発生し,処理速度が低下してしまう.そこで,既存のRaVioli/CUDAを拡張し,冗長なデータ転送が発生しない動画像処理が可能な環境を提供する手法を提案する.さらに,動画像処理のための高速化手法として,データ転送とGPUでの処理とをオーバーラップさせた上で,CPUとGPUを併用したパイプライン処理が使用可能となるようRaVioli/CUDAを拡張した.拡張後のRaVioli/CUDAを用いたプログラムの実行時間を,既存のRaVioli/CUDAと比較した結果,約1.3倍の高速化を達成することが確認できた.


Go back to index.

foobar