CSCトップページトータルコンサルティングサービス > 高速化サービス

高速化サービス

GPGPUコーディングサービスアプリケーション並列化サービスGPGPUソフトウェア共創サービスはこちら

GPGPUコーディングサービス

>> GPGPUを用いた高速なプログラムを迅速にご提供いたします

お客様が自作されたプログラムのソースコードをお預かりして、迅速にGPGPU対応のコードを作成しお渡しいたします。 出来るだけ早く、高速になったプログラムをお使いになりたい場合に最適のサービスです。

『GPGPU』とは、PCやワークステーションに付属のグラフィックカード(以下、GPU)を、グラフィック演算以外の汎用的な計算に適用する計算手法です。 GPUはCPUに比べて桁違いに多い計算コアを有しており、その計算コアを同時に多数活用して並列計算を行わせることで、 CPUに比べて劇的に高速に計算を行うことが可能です。しかし、実際にGPGPUで高速に計算を行わせるには、 GPUのハードウェアアーキテクチャ・ソフトウェアアーキテクチャに深く理解した上で、アプリケーションに合わせて GPU性能を最大限発揮させる並列プログラム開発のノウハウが必要となります。

HPCシステムズでは、長年にわたりGPGPUを専門に研究し、さらにOpenMPによるマルチスレッド並列とノードをまたぐMPI並列にも精通した、 高いプログラミングスキルを備えた技術者がご依頼に迅速に対応いたします。プログラムを高速化したいとお悩みの方は、是非私たちにご相談ください。 既にGPGPUによる数々の劇的な高速化効果を実現しています。

サービスの流れ


お問合せから納品まで、計算科学の専門家が親身に対応いたします!
お問合せ・データのご送付

まずはメール、電話にてお問い合わせください。ご用件をお伺いした後で、必要データをご送付いただきます。弊社はお預かりしたデータを厳重に管理し、受託内容に関して、秘密厳守で対応いたします。ご希望があれば秘密保持契約を結ばせていただきます。

《必要データ》
  • ソースコード(お客様自身が開発されたもので、弊社が改変可能なもの)
  • 実行用データ(数分~数時間で終了するもの)
  • 結果確認用データ(出力データ)
  • 外部ライブラリ(必要時)

  • 《対応可能条件 》
  • OS:Linux、Windows
  • 開発言語:C/C++、Fortran
  • GPGPUコンピューティング:CUDA
  • 性能プロファイリング・プログラム診断

    プログラム診断(プロファイラを用いたプログラム解析、ホットスポット調査、プログラムの机上調査、必要な通信帯域と計算量の見積もり、高速化可能性調査他)を行ない、レポートをお渡しします。
    《免責事項》プログラムの内容によっては、高速化を試みる前に開発をお断りさせていただくことがございます。

    OpenMPによる並列化コーディング

    OpenMPによるプロトタイプの実装と高速化の検証、精度の検証、GPGPU化可能性の検討を行ないます。
    《免責事項》
    1.プログラムの内容によってはこの作業を省略させていただくことがあります。
    2.GPGPUによる高速化が難しい場合は、ただちにその旨をご連絡し、開発を中断させていただくことがございます。

    GPGPUコーディング

    CUDAによるGPGPUの実装と高速化の検証、精度の検証を行ないます。
    《免責事項》マルチGPU対応コードの開発は、弊社で対応可能なものに限りオプションサービスで承ります。

    結果のご確認・評価

    評価用高速コードの開発が完了したら、ただちに速度評価を行い、ベンチマーク結果報告書と出力データをお渡しします。また、弊社に設置されたマシンにリモートログインしていただき、プログラムが高速に動作するのを実際に体験していただくことも可能です。

    お見積りのご提示

    お見積りのご提示、ハードウェアの選定とお見積り(ご依頼時) 、納品スケジュールの調整などを行ないます。

    弊社の高速化サービスは「成果が出てからのお見積り」だから安心です。計算速度が不十分、精度に問題がある等の何らかの理由で本サービスをキャンセルされる場合、その旨をご連絡いただいた時点でキャンセルとなり、キャンセル料およびこれまでの作業料金をいただくことはございません(但し、同業者の方の価格調査目的でのご利用はご遠慮下さい)。

    ご注文

    メール、FAX、郵送のいずれかで注文書をご送付ください。

    納品

    お客様ご指定の納品先に成果物をお届けします。ハードウェアと合わせてご注文いただいた場合、すぐに計算できる状態にセットアップして発送いたします。

    ● GPGPUコーディングサービス/概要(PDF)のダウンロード



    高速化事例のご紹介


    bench1bench2bench3

    ◆ GPGPU4台で4千500万粒子の、粒子法計算が可能になった!!(2010年3月8日)>>
    (記事抜粋) ~粒子法のプログラムの大規模化と高速化をわずか1日で、GPGPU4台を使う実装で実現してしまいました。 約4千500万粒子の流体計算100ステップの計算時間が約110分でした。 CPU1Core用のプログラムでは、計算時間がかかりすぎるため、1千万粒子程度しか計算できませんでした。 2010年3月時点での実装でも1億粒子程度であれば実用的な時間で計算可能と考えられます。
    ◆ GPGPUで76倍高速化(2010年3月8日)>>

    ◆ 粒子法計算が高速化、1億粒子1万ステップで約10日(2010年3月16日)>>

    ◆◇新着情報◇◆ 価格性能比12倍でCPUを圧倒!最新GPUに目が離せない!(2011年11月2日)>>

    このほか、「GPUで最速を極めるブログ」にてGPGPUによる高速化のレポートをリアルタイムにご覧いただけます。

    共同研究事例のご紹介

    横浜国立大学酒井研究室にて開発されたSPH粒子法によるシミュレーションエンジンをCUDAで高速化し、 さらにマルチGPUに対応させることで2000万粒子・10万ステップの自動車衝突解析が、約2週間で可能になりました。 この解析を従来の環境で行えば、数ヶ月はかかることが見込まれます。

    SPH粒子法による自動車衝突解析(1)

    SPH粒子法による自動車衝突解析(2)


    【開発環境】
  • CPU:Intel Xeon W3565(8M Cache, 3.20 GHz, 4.80 GT/s Intel QPI) x1
  • GPU:NVIDIA GeForce GTX580 x4
  • MEM:24GB(4GB DDR3 ECC Registered x6)
  • HDD:2TB(500GB,3.5型,SATA,7,200rpm x4)
  • OS:CentOS 5.5
  • Compiler:Intel Fortran Composer XE Linux版 12.0.3
  • GPGPUコンピューティング:CUDA 4.0
  • 横浜国立大学酒井研究室とHPCシステムズは、1億粒子・10万ステップにおよぶ大規模解析に向けてさらに共同研究を進めてまいります。

    サービス内容


    GPGPUコーディングサービス
     対象   請負希望のお客様
     概要   GPGPUによる並列化を請負(CUDA
     サービス内容 ※1

    STEP 1:データのお預かり~プログラム診断

  • プロファイラを用いたプログラム解析
  • ホットスポット調査
  • プログラムの机上調査
  • 必要な通信帯域と計算量の見積もり
  • 高速化可能性調査
  • STEP 2:OpenMPによる並列化コーディング

  • OpenMPによるプロトタイプの実装
  • OpenMP高速化の検証
  • OpenMP精度の検証
  • GPGPU化可能性の検討
  • STEP 3:CUDAによるGPGPUコーディング

  • GPGPUによる実装
  • GPGPU高速化の検証
  • GPGPU精度の検証
  • STEP 4:成果物の受け渡し

     必要データ
  • ソースコード(お客様自身が開発されたもので弊社が改変可能なもの) ※2
  • 実行用データ(数分~数時間で終了するもの)
  • 結果確認用データ(出力データ)
  • 外部ライブラリ(必要時)
  •  お客様が得ることのできる成果物
  • ソースコード使用権
  • プログラム診断レポート
  • ベンチマーク結果報告書
  • テクニカルサポート
  •  料金 ※3  ■コマーシャル  
  • ソースコード使用権:税込 1,498,000円
  • ■アカデミック
  • ソースコード使用権:税込 749,000円
  •  免責事項  ※1 高速化効果はアプリケーションによって異なります。
    ※2 お客様ご自身で開発されたプログラムに限ります。
    ※3 コーディング内容により価格は変わります。

    改変部分(オリジナルとの差分情報)と、改変にあたり行った変更の全てについての著作権は弊社が保有します。著作権の譲渡、販売権、授与権、開示権、貸与権、再配布権、あるいは改変権については別途ご相談ください。 
    【対応可能要件】
  • OS:Linux、Windows
  • 開発言語:C/C++、Fortran
  • GPGPUコンピューティング:CUDA
  • オプション対応:マルチGPU対応コード開発
  • ※コンサルティングをご希望の方は別途承ります。お問い合わせください。

    ● GPGPUコーディングサービス/概要(PDF)のダウンロード



    高速化無料体験サービスのご案内


    もしプログラムの実行速度が30倍になれば、1ヶ月かかる計算も1日で終わり、10日かかる計算も8時間で終わります。研究や仕事の可能性が無限に広がります。 お使いのプログラムの実行速度にお悩みでしたら、HPCシステムズの「高速化無料体験サービス」をお試しください。最新の64~80コアコンピュータ、 または4基のTesla M2090を搭載したコンピュータで、プログラムが数十倍の速度で動作するのを実際に体験することができます。プログラムの高速化はHPCシステムズのエキスパートがお客様に代わり迅速に行ないます。詳細は下記のバナーをクリックして下さい。


    NVIDIA社のウェブサイトに掲載されました


    弊社の提供するGPGPUコーディングサービスが、GPUコンピューティングに対応したソリューションとして、NVIDIA社の 「GPUコンピューティング ソリューションファインダー」に掲載されました。
    ■NVIDIA社サイト:GPUコンピューティング ソリューションファインダー

    GPGPUシリーズ製品ラインナップ





    アプリケーション並列化サービス

    >> 複数コアの有効活用で、計算の高速化と効率化を実現します

    お手持ちのコンピュータが、「デュアルコア」「クアッドコア」などCPUに複数の“コア(※1)”が搭載されていたり、複数のCPUが搭載されているような場合でも、結局、1つのコアだけで計算を行っていないでしょうか?

    例えば、4コア搭載のコンピュータであっても、普通にコンパイルされたプログラムを実行したのでは1コアしか使用されず、3コアは遊んでいる状態です。しかも3コア分の電力を無駄に消費していることにもなりかねません。この働いていないコアを有効に活用し、4コア すべてを計算に使うことができれば、3倍程度(※2)の計算速度の向上が望めます。しかも、速度向上によって計算が速く終わることから、1コアでの計算に比べて少ない消費電力で目的を達成できます。すなわち、より“環境にやさしいエコな計算”を行うことができると言えます。また、ノードを跨いで複数のコアを計算に使用することもできます。この場合は単体ノードに搭載できるコア数以上のコアを計算に使用することができるだけでなく、メモリ量も単体ノードの制約から解放され、16コアで10倍程度(※2)の速度向上が望めます。

    CPUの速度向上率が停滞している今、プログラムの書き換えによって実行速度を劇的に伸ばす手段として、複数コアを並列に使用して 計算を行う“並列化技術”が注目されています。複数のコアを効果的に使い、計算を正しく実行するためには、これまでと少し異なるプログラム技術が必要になります。弊社には、コンピュータに搭載されているすべてのコアを1つの計算に対して集中的に、有効に使用するための知識と技術の蓄積があります。私たちの知識と技術を、是非ご活用ください。

    ※1 コア=CPU内部には、命令を処理するための“コア”と呼ばれるユニットがあります。近年市販されているCPUの多くはコアが2つから8つ搭載されており、複数の命令を同時に(並列に)処理することができます。
    ※2 目安としての数値であり、実際の計算速度と異なる場合があります。

    高速化事例のご紹介




    ◆ プログラム並列化でスピード向上!さらに2つの高速化事例をご紹介します(2010年1月7日)>>

    ◆◇新着情報◇◆ 64コアで、なんと61倍の高速化を達成!(2011年11月10日)>>

    サービス内容


    アプリケーション並列化サービス
     対象  請負希望のお客様
     概要  ノード内並列化を請負(OpenMP ノードをまたいだ並列化を請負(MPI
     サービス内容 ※1  12コアを使用して5~8倍程度を目指します  16コアを使用して8~10倍程度を目指します 
     必要データ
  • ソースコード(お客様自身が開発されたもので弊社が改変可能なもの) ※2
  • 実行用データ(数分~数時間で終了するもの)
  • 結果確認用データ(出力データ)
  • 外部ライブラリ(必要時)
  •  お客様が得ることのできる成果物
  • ソースコード使用権
  • プログラム診断レポート
  • ベンチマーク結果報告書
  • テクニカルサポート
  •  料金 ※3  ■コマーシャル  
  • ソースコード使用権:税込 798,000円
  • ■アカデミック  
  • ソースコード使用権:税込 399,000円
  • ■コマーシャル  
  • ソースコード使用権:税込 998,000円
  • ■アカデミック  
  • ソースコード使用権:税込 499,000円
  • 免責事項 ※1 高速化効果はアプリケーションによって異なります。
    ※2 お客様ご自身で開発されたプログラムに限ります。
    ※3 コーディング内容により価格は変わります。 

    改変部分(オリジナルとの差分情報)と、改変にあたり行った変更の全てについての著作権は弊社が保有します。著作権の譲渡、販売権、授与権、開示権、貸与権、再配布権、あるいは改変権については別途ご相談ください。 
    【対応可能要件】
  • OS:Linux、Windows
  • 開発言語:C/C++、Fortran
  • ※コンサルティングをご希望の方は別途承ります。お問い合わせください。


    HPC製品ラインナップ




    テクニカルサポートについて

    高速化サービス(GPGPUコーディングサービスアプリケーション並列化サービス)では、お客様の計算環境構築を支援し、円滑なシステム運用を実現するためにメール・電話でのプロフェッショナルなテクニカルサポートをご用意しています。

    ■サポートプラン

  • Standard
  • 成果物の初期セットアップ時※1 やコンピュータの不具合・起動不良・故障等で再セットアップが必要になった際に、弊社内で検証し正常動作を確認した環境と同等の環境※2 へ復帰させるまでの解決策を提案いたします。※3 成果物の納品から1年間は10回まで無償、以降は有償対応となります。

  • Standard+(plus)
  • 成果物の初期セットアップ時※1 やコンピュータの不具合・起動不良・故障等で再セットアップが必要になった際に、弊社内で検証し正常動作を確認した環境と同等の環境※2 へ復帰させるまでの解決策を提案いたします。※3 契約期間中は回数無制限でサポートいたします。また、リモートでのトラブルシューティング※4 にも対応いたします。

    プラン
    Standard Standard+(plus)
    インシデント数
    1年間に10回まで
    無制限
    受付時間
    平日9時~17時(土休日・年末年始除く)
    コミュニケーション
    メールのみ
    メールおよび電話
    障害切り分け
    YES 
    リモートトラブルシューティング
    NO
    YES
    価格 ※5
    年間契約価格
    (初年度無料)
    年間契約価格
    • ※1 弊社推奨以外のコンピュータへのセットアップはサポート対象外となります。お持ちのコンピュータへのセットアップをご希望の方はご相談ください。弊社で対応可能なものに限りオプションサービスで承ります。
    • ※2 セットアップ後、弊社の同意を得ることなく再改変されたプログラムの動作保証およびサポートはお受け致しかねます。プログラムアップデート時の再コーディング、動作テストをご希望の方はご相談ください。弊社で対応可能なものに限りオプションサービスで承ります。
    • ※3 交換部材の手配、および、ハードウェア交換作業につきましては、お客様に行っていただきます。
    • ※4 お客様のご利用環境によっては、対応できない場合があります。
    • ※5 標準サービスとして初年度に限り10インシデント分のテクニカルサポートStandardがついております。追加インシデントおよびテクニカルサポートStandard+ (plus)の価格につきましては別途ご相談ください。

    ■オプションサービス
  • アップデートサポート・・・プログラムアップデート時の再コーディング、動作テストをサポートするサービスです。
  • セットアップ代行サービス・・・お客様がお持ちのコンピュータに成果物をセットアップするサービスです。


  • ※サービスの詳細はお問い合わせください。

    コンサルティングサービス  高速化サービス  → 簡便化サービス