Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

OpenACC の検索結果:

NVIDIAのGPUだけが売れるのは?何故?

…DA、OpenCL、OpenACCなどでプログラムを書いて、GPUでのアクセラレーションをしました。 その中でも、CUDAは新しいGPUが出る度にバージョンアップし、現在のHopper(H100)/Ada Lovelace(RTX40X0)に対応したのが 2022年10月にリリースされた 11.8 です。 CUDAの振り返り 1.0 (June 2007) : Tesla 2.0 (Aug 2008) : 3.0 (March 2010) : Fermi 4.0 (May 2…

Intel、AMD、NVIDIAのGPUプログラミング

…です。その代わりに、OpenACCなるもので #pragma を使って書いていました。 このブログでの、OpenACCに関することは非常に多く書いた記憶があります。 vengineer.hatenablog.com OpenACCについては、PGIとCAPS Enterpriseがいろいろとやっていましたが、CAPS Enterpriseは破綻。PGIはNVIDIAに買収されました。 おわりに 現時点では、 oneAPI OpenMP HIP CUDA でプログラミングするこ…

NVC++ (NVIDIA HPC SDK C++ Compiler)

…on A100 と OpenACC on A100 でおぼ同じだと。 NVIDIA HPC SDK は、こちら。 developer.nvidia.com なお、Volta、Turing、Ampare しか対応していないって。TensorCore対応のGPUのみなんでしょうかね。 The NVC++ compiler can automatically offload C++ Parallel Algorithms to NVIDIA GPUs based on the Vo…

GCC 10 で、OpenACC 2.6/OpenMP 5.0 をサポート

…ドを書いていたとき、OpenACCで書いて、コンパイラがサクッとアクセラレータ用コードに変換してくれるコンパイラを使ったが便利だったわ。 そんな経験が GCC でもできるようになってきたのは非常に嬉しい限りですが、 そんなコードを書く機会は、たぶん、ほとんどない気がする。つまり、需要がない。。 gcc.gnu.org P.S Arm系CPUコアのサポートも強化 Cortex A77 Cortex A76AW Cortex A65/A65A Cortex A34 Marvell…

Intel Data Parallel C++ 関連書籍

…OpenCLやCuda、OpenACCなどのプログラムを書いたことがあるのならそれほど戸惑うことは無いと思います)。 Intel、DPC++ にて、CPU/GPU/AI/FPGA をすべてプログラミングできるようにするって頑張っていますが、生Cudaのプログラムを書く人すら少ないのに本当に普及すると思っているのだろうか? AIに関しては、NervanaからHabanaに移行するけど、HabanaでDPC++をサポートするのだろうか?は、かなり疑問符が付くと思うんだけどね。。。

OpenACCは生きていて、CUDAで書くより速くなる場合もあるって?

…メントで、ちょこっとOpenACCのことを書きましたが、最近のOpenACCのことを調べてみたら、なんか出てきました。 これ、 qiita.com え、CUDAよりOpenACCの方が速くなってって? このブログの過去ログみたら、結構OpenACCのこと書いていました。 vengineer.hatenablog.com 昔、CAPSという会社のOpenACCを使った時があって、いかにCUDAで書いたコードと同じ処理速度が出せるかを試したことがあります。その時はほぼ同じぐらいに…

Intel SYCL Compiler のドキュメント

…図も載っています。 OpenACCのように、ホスト側のコードとデバイス側のコードを分けて、それぞれのコンパイラでコンパイルして、最終的に両方のオブジェクトをまとめて、Fat Library にするって感じですね。NVIDIAのCUDAのプログラムと同じ感じですかね。 (そう言えば、OpenACCって、OpenMPと一緒になったんですかね?) OpenACC - Wikipedia には、 Version 2.5 of the specification was release…

AMDのCPU用コンパイラ

…トもあります。ドキュメントと言っても、GNUのマニュアルのようです。 GPUのプログラミングって、OpenACCでも使うのかしら。 ROCm Core Technologyでは、clang/llvm を提供しているしね。 HCC:An open source C++ compiler for heterogeneous devicesなるものもあるんだけどね。 HCCだと、 ・HIP ・C++ AMP ・C++ Parallel STL C++ AMP なんか、懐かしい。。。

PGI 18.4、Community Editionも18.4に

…peed ・ull OpenACC 2.6 (Tesla GPUs and multicore CPUs) ・OpenACC for CUDA Unified Memory ・Dramatically Lower Development Effort ・AVX-512 Support ・New C++17 Features ・OpenMP 4.5 for Multicore CPUs ・PGI Unified Binary for Tesla and Multicore ・P…

PGI 2018.1

…rformance OpenACC : 2-socket Broadwellに対して、1x Volta V100では、4.4倍高速 OpenMP 4.5 : Intel 2018 より PGI 18.1の方が速い ・Support for the Latest CPUs Intel Skylake, IBM POWER8, AMD Zen PGI Fortran 2003, C11, C++14 Linux x86, Linux OpenPOWER, macOS ・Ubunt…

PGI Community Edition, 2017.10

…penMP and OpenACC Fortran 2003 compiler. ・PGCC® native OpenMP and OpenACC ANSI C11 and K&R C compiler. ・PGC++® native OpenMP and OpenACC ANSI C++14 compiler. ・PGI Profiler® OpenACC, CUDA, OpenMP, and multi-thread graphical profiler. ・PGI De…

PathScaleが危ないようだ

… OMP4 and OpenACC and is portable across multiple architectures (NVIDIA GPU, ARMv8, Power8+NVIDIA and AMD GPU) • Significant modifications to CLANG and LLVM to enable support for OpenACC and OpenMP and parallel programming models. • Complet…

IPMACC Framework

…CL, and ・gcc/ispc in case of ISPC target. Examples: とありますね、Intel ISPCも使えるんですね。 論文は、IPMACC: Open Source OpenACC to CUDA/OpenCL Translator こちらも、IPMACC: Translating OpenACC API to OpenCL OpenACC cache Directive: Opportunities and Optimizations

OpenMPCon 2016のプレゼンテーションスライド

…te: Evaluating OpenMP’s Effectiveness in the Many-Core Era Simon McIntosh-Smith, University of Bristol をチラ見したら、OpenMP 4.xならマルチコアだけでなく、 GPU(NVIDIAやAMD)だけでなく、Intel Xeon PhiもOKなんですね。 OpenMP4.5については、 自分のブログ、OpenACC 2.5 vs OpenMP 4.5にアップしていましたわ。

PGI Community Editionは、無償

…gの世界へようこそ、すべては、SystemC v0.9公開から始まった このツイートで知った。 これにある “PGI Community Edition” が登場 – OpenACC の普及を加速 によると、PGI Community Editionは、無償なようだ。 PGI Community Edition、Linux版で1.1GBもありますが、 P.S 何故か、山田が写っている。 追記)、2016.11.26 SoftekのPGI Community Editionの頁

OpenACC 2.5 vs OpenMP 4.5

…Comparing OpenACC 2.5 and OpenMP 4.5 てか、CAPSが無くなって、PGIがNVIDIAに買収されたので、 OpenACCって、NVIDIAさとCrayだけ? OpenMPでもアクセレーション用のプラグマをサポートしたのでいいかな?と思っていましたが、 どうもそうではないようですね。 NVIDIAのGPUをCUDA使って、ガリガリ書けるのなら、特に問題無いですが、 既存のCやFortranのコードをCUDAに書きなおすのって、結構辛いので、 …

TOP100

…う人には使えませんね。 Xeon + NVIDIA GPU、Xeon Phiではないコンピュータが1位になったのは、 これから面白くなるということですかね。 GREEN500の1位のPEZYもそうですからね。 楽しそう。 追記)、2016.07.02 牧野先生のツイートから安藤さんのブログ:Top500の1位は中国の太湖之光 安藤さんって、どなた?って、Google君に聞いてみてください。 TaihuLightで、OpenACCを関連ツイート、、その1、その2、その3、その4

CUDAとOpenCLどっちがいいの?

…?という記事を書いています。 CUDA、OpenCL、OpenGL Compute Shader、DirectX DirectCompute、C++ AMP、HIP、OpenACC、OpenMP、SYCLについての解説と、実際に何を使えばいいのかを解説してくれています。 あたしも昔、同じような内容を「ウサギィ」におじゃました時、お話したような。 あたし的には、OpenMP 4.0 & CUDAがあればいいような気がしますが、 OpenCLをどう考えるか。。。 そこが問題です。

GCC 6でOpenACC 2.0をサポート

…7月1日に、GCCがOpenACCをサポートを書きましたが、 GCC 6では、OpenACC 2.0をサポートするようです。 OpenACC 2.0 Is In Good Shape For GCC 6, Complete With NVIDIA Offloading Offloadingの機能は、NVIDIA GPUs via the NVPTX、x86_64、PowerPC 64-bit LEアーキテクチャで サポートされるようですね。 Document OpenACC …

Pathscale Compiler

…ive codes OpenACCやOpenMP 4.0 C/C++/Fortranにも対応しているようです。 HPCにARMv8コアがたんまり入ったSoC搭載のサーバーが投入され始めましたので、 このようなエコシステムは必要になるんでしょうね。 ARM Compiler 6.0では、OpenACCやOpenMP 4.0はサポートしていませんからね。 IntelやAMDのx86勢力に対して、ARMは非常に多くの企業が関わってきていますので、全体としてのエコシステムは非常に重要…

OpenMPCon 2015のプレゼンテーションスライド

… National Lab ・Oak Ridge National Laboratory ・University of Edinburgh ・SUSE Linux ・Princeton University ・Oracle ・RWTH Achen University ・Appentra Solutions & University of A Coru??a Intelが多いですね。 OpenMPとOpenACC 2.0、OpenCLに比較もあります。 お暇な時に。。。でも。

OpenACC

…た NVIDIAは、OpenACCを推しています。 何故なら、プラグマ等を書くだけで、CUDAコードとそのホストコードを自動的に生成してくれるため。 そのために、PGIを買収しました。 Combine OpenACC and Unified Memory for Productivity and Performanceでは、 OpenACCとUnified Memoryを使えば、生産性と性能が向上すると。 OpenACC 2.5というのも出ているので、OpenACCは進化して…

OpenAC C Toolkit

…った NVIDIAがOpenACC Toolkitをアカデミックに対して、無償ライセンスを発行するようです。 OpenACC Toolkit More Science, Less Programming with New NVIDIA OpenACC Toolkit OpenACCは、OpenMPのようにC/C++にプラグマを入れて並列化するツールです。 Cudaに慣れ親しんでいなくても、OpenACCを使えば、サクッとCudaが利用できます。 ものによっては、Cudaと同じ…

GCC 5.0.1でOpenACC

…ら始まった GCCがOpenACCをサポートを書いたのは、昨年の7月1日。 で、OpenACC support in GCCによると、GCC 5.0.1でOpenACCが使えるようです。 ただし、通常のGCCではなく、それなりの準備が必要なのですね。 CAPSが無くなって、OpenACCをサポートしているのはNVIDIAに買収されたPGIのみ。 サンプルコードでは、 NVIDIA K20m GPU と Intel Xeon E5-2670v2 CPU の処理時間比較で、 5~…

CAPSのソースコードは売りに出ていた。

@Vengineerの戯言 : TwitterSystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった CAPSが破綻?から5ヶ月。 今日、Twitterで拾ったCAPS OpenACC compiler source code for saleによると、2014年7月7日に、ソースコードを売りに出していたようですね! 何処かが買ったのでしょうかね?

ブラウザでGPUの勉強ができる

…Learn GPU Programming in Your Browser with NVIDIA Hands-On LabsqwikLABによると、ブラウザでGPUのプログラミングが勉強できると。 現在、下記の4つのコースが公開されています。 ・Introduction to CUDA; ・OpenACC; ・Multi-GPU programming with CUDA; ・GPU Memory Optimizations. なんか、IPythonを使っているみたいです。

cuDNN

…uDNNを組み込んだCaffeは、組み込んで無いものより20%以上高速に。 NVIDIAもアプリケーション用のライブラリをどんどん出していくのでしょうかね? 研究機関だけでなく、一般企業でも使ってもらえるように。 OpenACCもそのための道具でしたが、CAPSが無くなってしまってちょっと停滞中かな? GCCでサポートされれば、ぐーと、利用されるかもしれないが、それはまだ先の話。 いっそ、PGI CompilerのOpenACC版は無償提供にすればいいのかも? どうだろうか?

GCCがOpenACCをサポート

…upport both OpenACC and Intel Xeon Phi Offload Pragmas in 2015によると、 GCCでOpenACCとXeon Phi Offloadプラグマを2015年にサポートするようです。 GCC 4.10でサポートするようで、 OpenMP 4.0とOpenACC 2.0を同じ構文で記述できるようになる感じですね。 商用では既に、PGIとCAPSが出していますのが、 来年以降はフリーのコンパイラでも利用できるのは嬉しいですね。

OpenACC @ ISC'14

…nference)にて、OpenACC関連のセッションが2つ。 OpenACC & the Evolution of the Modern GPU BoF 08: Experiences with & the Future of OpenACC 日本では、まだまだ盛り上がりが欠けるOpenACCですが、 世界では着実に前進してますね。 今年のGTC Japanでは、OpenACC、どうなりますかね? 成瀬さんのセッション、CUDA6/OpenACCチュートリアルがありますね。

Open SourceなOpenACC Compiler

…SystemC v0.9公開から始まった マイナビで紹介されたGTC 2014 - オープンソースのOpenACCコンパイラの状況 OpenUH、Open Source UH Compiler。 Open64ベースのコンパイラで、x86-64, IA-32, IA-64, MIPS, PTXの対応。 OpenMP 3.0に対応。 2005年のプレゼン資料、2006年の資料、2009年の資料、GTC2014のポスター そして、OpenACC対応のコードは、こちら(github)