| GPGPUコーディングサービス | アプリケーション並列化サービス | GPGPUで高速化して販売したい方はこちら |
お客様からソースコードをお預かりして、迅速にGPGPU対応のコードを作成しお渡しいたします。 出来るだけ早く、高速になったプログラムをお使いになりたい場合に最適のサービスです。
『GPGPU』とは、PCやワークステーションに付属のグラフィックカード(以下、GPU)を、グラフィック演算以外の汎用的な計算に適用する計算手法です。 GPUはCPUに比べて桁違いに多い計算コアを有しており、その計算コアを同時に多数活用して並列計算を行わせることで、 CPUに比べて劇的に高速に計算を行うことが可能です。しかし、実際にGPGPUで高速に計算を行わせるには、 GPUのハードウェアアーキテクチャ・ソフトウェアアーキテクチャに深く理解した上で、アプリケーションに合わせて GPU性能を最大限発揮させる並列プログラム開発のノウハウが必要となります。
HPCシステムズでは、3年以上にわたってGPGPUを専門に研究し、さらにOpenMPによるマルチスレッド並列とノードをまたぐMPI並列にも精通した、
高いプログラミングスキルを備えた技術者がご依頼に迅速に対応いたします。
プログラムを高速化したいとお悩みの方は、是非私たちにご相談ください。
既にGPGPUによる数々の劇的な高速化効果を実現しています。
(記事抜粋) ~粒子法のプログラムの大規模化と高速化をわずか1日で、GPGPU4台を使う実装で実現してしまいました。 約4千500万粒子の流体計算100ステップの計算時間が約110分でした。 CPU1Core用のプログラムでは、計算時間がかかりすぎるため、1千万粒子程度しか計算できませんでした。 2010年3月時点での実装でも1億粒子程度であれば実用的な時間で計算可能と考えられます。◆GPGPUで76倍高速化>>
| 対象 | 請負希望のお客様 |
|---|---|
| 概要 | GPGPUによる並列化を請負 |
| サービス内容 ※1 | |
■ ソースコードのお預かりSTEP 1:性能プロファイリング・プロファイラを用いたプログラム解析・ホットスポット調査 ・プログラムの机上調査 ・必要な通信帯域と計算量の見積もり ・高速化可能性調査 STEP 2:OpenMPによる並列化コーディング・OpenMPによるプロトタイプの実装・OpenMP高速化の検証 ・OpenMP精度の検証 ・GPGPU化可能性の検討 STEP 3:GPGPUコーディング・GPGPUによる実装・GPGPU高速化の検証 ・GPGPU精度の検証 ■ 成果物のお渡し |
|
| 必要事項 |
・ソースコード ・プログラムの背景や仕様を理解する助けとなる資料 ・サンプルインプットファイル(数分~数時間で終了するもの) ・外部ライブラリ(必要時) ・メール/電話による打ち合わせ |
| お客様が得ることのできる成果物(出力) |
・ソースコードまたはバイナリコード使用権 ・高速化報告書 ・テクニカルサポート(1年間に10回まで) |
| 料金(税込)※2 | 通常価格: キャンペーン価格: ・ソースコード提供:1,498,000円~ ・バイナリコード使用権:298,000円~/年間 |
| 注意事項 | ※1 高速化効果はアプリケーションによって異なります。 ※2 コーディング内容により価格は変わります。 改変部分(オリジナルとの差分情報)と、改変にあたり行った変更の全てについての著作権は当社が保有します。著作権の譲渡、販売権、授与権、開示権、貸与権、再配布権、あるいは改変権については別途ご相談ください。 |
対応可能条件
OS:Linux(ディストリビューション問わず)/Windows
開発言語:C/C++、Fortran GPGPUコンピューティング:CUDA
※コンサルティングをご希望の方は別途承ります。詳細はお問合せください。
お手持ちのコンピュータが、「デュアルコア」「クアッドコア」などCPUに複数の“コア(※1)”が搭載されていたり、複数のCPUが搭載され ているような場合でも、結局、1つのコアだけで計算を行っていないでしょうか?
例えば、4コア搭載のコンピュータであっても、普通にコンパイルされたプログラムを実行したのでは1コアしか使用されず、3コアは遊ん でいる状態です。しかも3コア分の電力を無駄に消費していることにもなりかねません。この働いていないコアを有効に活用し、4コア すべてを計算に使うことができれば、3倍程度(※2)の計算速度の向上が望めます。しかも、速度向上によって計算が速く終わること から、1コアでの計算に比べて少ない消費電力で目的を達成できます。すなわち、より“環境にやさしいエコな計算”を行うことができる と言えます。また、ノードを跨いで複数のコアを計算に使用することもできます。この場合は単体ノードに搭載できるコア数以上のコア を計算に使用することができるだけでなく、メモリ量も単体ノードの制約から解放され、16コアで10倍程度(※2)の速度向上が望めます。
CPUの速度向上率が停滞している今、プログラムの書き換えによって実行速度を劇的に伸ばす手段として、複数コアを並列に使用して
計算を行う“並列化技術”が注目されています。複数のコアを効果的に使い、計算を正しく実行するためには、これまでと少し異なる
プログラム技術が必要になります。計算科学コンサルティングには、コンピュータに搭載されているすべてのコアを1つの計算に対して
集中的に、有効に使用するための知識と技術の蓄積があります。私たちの知識と技術を、是非ご活用ください。
◆プログラム並列化でスピード向上!2つの高速化事例をご紹介します>>
| 対象 | 請負希望のお客様 | |
|---|---|---|
| 概要 | ノード内並列化を請負 | ノードをまたいだ並列化を請負 |
| サービス内容 ※1 | 4コアを使用して3倍程度を目指します | 16コアを使用して10倍程度を目指します |
| 必要事項 | ・ソースコード ・プログラムの背景や仕様を理解する助けとなる資料 ・サンプルインプットファイル(数分~数時間で終了するもの) ・外部ライブラリ(必要時) ・メール/電話による打ち合わせ |
|
| お客様が得ることのできる成果物(出力) | ・ソースコードまたはバイナリコード使用権 ・高速化報告書 ・テクニカルサポート(1年間に10回まで) |
|
| 料金(税込)※2 | 通常価格: ・ソースコード提供:1,000,000円~ ・バイナリコード使用権:200,000円~/年間 キャンペーン価格: ・ソースコード提供:498,000円~ ・バイナリコード使用権:98,000円~/年間 |
通常価格: ・ソースコード提供:2,000,000円~ ・バイナリコード使用権:400,000円~/年間 キャンペーン価格: ・ソースコード提供:998,000円~ ・バイナリコード使用権:198,000円~/年間 |
| 注意事項 | ※1 高速化効果はアプリケーションによって異なります。 ※2 コーディング内容により価格は変わります。 改変部分(オリジナルとの差分情報)と、改変にあたり行った変更の全てについての著作権は当社が保有します。著作権の譲渡、販売権、授与権、開示権、貸与権、再配布権、あるいは改変権については別途ご相談ください。 |
|
【対応可能条件】
OS:Linux(ディストリビューション問わず)/Windows
開発言語:C/C++、Fortran
※コンサルティングをご希望の方は別途承ります。詳細はお問合せください。
高速化サービス(GPGPUコーディングサービス、アプリケーション並列化サービス)では、お客様の計算環境構築を支援し、円滑なシステム運用を実現するために、メール・電話でのプロフェッショナルなテクニカルサポートをご用意しています。
■サポートプラン
・Standard
成果物(高速化ソースコードまたは高速化バイナリコード)の初期セットアップ時※1やコンピュータの不具合・起動不良・故障等で再セットアップが必要になった際に、弊社内で検証し正常動作を確認した環境と同等の環境※2へ復帰させるまでの解決策を提案いたします。※3成果物の納品から1年間は10回まで無償、以降は有償対応となります。
・Standard+(plus)
成果物(高速化ソースコードまたは高速化バイナリコード)の初期セットアップ時※1やコンピュータの不具合・起動不良・故障等で再セットアップが必要になった際に、弊社内で検証し正常動作を確認した環境と同等の環境※2へ復帰させるまでの解決策を提案いたします。※3契約期間中は回数無制限でサポートいたします。また、リモートでのトラブルシューティング※4にも対応いたします。
プラン |
Standard | Standard+(plus) |
|---|---|---|
インシデント数 |
1年間に10回まで |
無制限 |
受付時間 |
平日9時~17時(土休日・年末年始除く) |
|
コミュニケーション |
メールのみ |
メールおよび電話 |
障害切り分け |
YES |
|
リモートトラブルシューティング |
NO |
YES |
価格 ※5 |
年間契約価格 (初年度無料) |
年間契約価格 |