IT TIP

OpenCL / AMD : 딥 러닝

itqueen 2020. 12. 12. 12:53
반응형

OpenCL / AMD : 딥 러닝


"googl'ing"어떤 연구를하고있는 동안 나는 찾을 수 없었다 어떤 과학 GPGPU 컴퓨팅 및 심각한 / 인기있는 프레임 워크 / SDK 의 OpenCL 에 대한 AMD의 하드웨어를. 내가 놓친 문헌 및 / 또는 소프트웨어가 있습니까?

특히 저는 딥 러닝에 관심이 있습니다 .

내가 아는 모든 것에 대해 deeplearning.netNVIDIA 하드웨어와 CUDA 프레임 워크를 권장 합니다. 또한 Caffe , Theano , Torch , DL4J 등과 같이 내가 아는 모든 큰 딥 러닝 프레임 워크 CUDA에 초점을 맞추고 있으며 OpenCL / AMD 를 지원할 계획이 없습니다 .

또한 많은 과학 논문과 CUDA 기반 딥 러닝 작업에 대한 해당 문헌을 찾을 수 있지만 OpenCL / AMD 기반 솔루션에 대해서는 거의 없습니다 .

새로운 또는 기존 과학적 프레임 워크가 2015/16 년 OpenCL / AMD 기반 솔루션에 나타날 가능성이 있습니까?

OpenCL / AMD를 사용한 딥 러닝 의 좋은 시작은 무엇입니까 ? 어떤 문학? 튜토리얼? 기타 소스?


편집 1 Mikael Rousson의 답변 보기 -Amazon 은 이제 컴퓨팅 능력을 "임대"할 수있는 방법입니다.

편집 2 를 사용하여 딥 러닝을 위해 Amazon EC2 인스턴스를 설정하는 방법에 대한 일련의 가이드만들었 습니다 theano. 그것은이다 더 많은 개인 컴퓨터에서 실행하는 것보다 편리합니다.

편집 3 TensorFlow는 이제 theano가이드를 그에 따라 업데이트 한 것보다 훨씬 더 널리 받아 들여지는 것 같습니다 .

저는 Intel Iris 그래픽이 탑재 된 MacBook Pro를 가지고있는 것과 같은 상황에있었습니다. 가능한 모든 해결 방법을 살펴보면서 일주일 중 가장 좋은 시간을 보냈으며 내가 제공하는 대안에 대한 대안을 환영합니다.

현재 내가 가지고있는 최선의 해결책은 다음과 같습니다.

  1. python라이브러리를 설치하고 tensorflow지원되는 GPU를 활용하고 최신 개발 버전으로 계속 업데이트하십시오.
  2. 사용 theano- 기존 GPU 지원을 유사하게 사용tensorflow
  3. NVIDIA 그래픽 카드를 구입하여 PC에서 사용하십시오.
  4. OpenCL의 솔루션이 절대적으로 필요하고 높은 수준의 이해 (튜토리얼 없음)에서 모든 것을 코딩하려는 경우 DeepCL 및 가능하면 pyOpenCl을 살펴 보십시오 .

OpenCL을 사용하는 모든 솔루션 (예 : pyOpenCl )에는 아직 딥 러닝을위한 사용자 친화적 인 인터페이스가 없습니다. 즉, 빠르게 코딩하고 CPU에서 실행하는 것보다 대체 방법으로 코딩하는 데 시간이 더 오래 걸립니다. 하지만 딥 러닝을위한 최고의 대체 OpenCL 라이브러리는 다음과 같습니다.

개발 중


--- 2017 년 8 월 AMD 측에서 멋진 새로운 일이 일어났습니다 .---

지금은 대부분의 AMD 하드웨어에 어떤 라이브러리를 실행하는 데 실제로 가능하다 여기 확인

2015 년 10 월 25 일 기준

AMD와 다른 회사들은 딥 러닝을위한 여러 OpenCL 가속화 프레임 워크 개발에 손을 뻗어있는 것 같습니다. 그래서 예 OpenCL 지원은 이제 딥 러닝을 위해 존재합니다. :)

이것은 주로 딥 러닝을 염두에두고 개발 된 OpenCL 가속 프레임 워크 또는 도구 목록입니다. 앞으로 몇 년 동안 업데이트되기를 바랍니다.

우리는 지금 (2015 년 10 월 25 일) 연구자들에게 매우 인기 있고 일부 상용 제품을 본 세 가지 딥 러닝 프레임 워크가 있음을 알고

  1. 테 아노

  2. 카페

  3. 토치


caffe는 amd가 caffe의 거의 모든 기능을 지원하는 완전한 버전의 caffe를 개발했으며 활발하게 개발되고 있기 때문에 OpenCL을 상당히 잘 지원합니다. OpenCL Caffe라고합니다. 여기에 저장소가 있습니다.

OpenCL 카페

성능에 대해 생각하고 있다면 해당 사이트 (내가 직접 벤치마킹하지 않음)에 따르면 AMD R9 Fury 하드웨어 (훈련)에서 초당 약 261 개의 이미지 또는 2,250 만 개의 이미지를 제공합니다. 하루에 4 천만 개의 이미지를 처리 ​​할 수있는 nvidia K40과 비교해 보겠습니다. 따라서 사이트에 따르면 1/6 돈으로 절반의 성능을 제공 할 수 있습니다 (k40은 3000 $ 카드이고 r9 fury는 600 $ 정도입니다). 그러나 소비자 카드를 사용하면 딥 러닝에서 매우 중요한 메모리 (vram)에 대한 문제가 발생합니다.


최근 토치는 OpenCL 지원도 괜찮은 것 같습니다. 그러나 그것은 한 사람에 의해 유지됩니다. 토치의 모든 기능을 완벽하게 지원한다고 주장합니다. 그러나 성능에 대한 아이디어는 제공하지 않습니다. 다음은 저장소입니다. 적극적으로 유지됩니다.

cltorch


Currently there does not seems to be a decent opencl backend for theano framework but work is in progress. and simple programs can be done with the current version.


There are some other opencl frameworks for deeplearning too. It will take some time to sort them out to see if they work properly or not.


An alternative is to use GPU instances on Amazon Web Services. You can find AMIs with commonly used deep learning packages already installed. For example:

Tip: use spot instances to get a cheaper price (around 10 cents/hour for a g2.2xlarge).


PlaidML (https://github.com/plaidml/plaidml) is a fully open source deep learning runtime that runs on top of OpenCL and integrates with Keras to provide a familiar user-facing API. The README in the repo has more detailed status, currently convnet inference on Linux is well supported but we (http://vertex.ai) are working to expand completeness and platform support as quickly as we can. Our continuous integration machines include an assortment of AMD and NVIDIA GPUs, all Linux for now but we are also working on adding Mac and Windows.


I'm writing opencl 1.2 support for Tensorflow. https://github.com/hughperkins/tensorflow-cl Currently supports:

  • blas matrix multiplication
  • gradients
  • eigen operations such as: reductions, argmin/argmax, per-element operations (binary and unary)

TensorFlow now have OpenCL support on the roadmap.

See: Github issue.

Hopefully not that far away from a working version.


Please check out https://01.org/intel-deep-learning-framework - The Intel® Deep Learning Framework (IDLF) provides a unified framework for Intel® platforms accelerating Deep Convolutional Neural Networks. It is Open Source, so you could port it to AMD hardware as well. The cool thing: it could run on a MacBook Pro with Intel Iris graphics.


Check out the ROCm platform, which is driven by AMD. This is the first open-source HPC/Hyperscale-class platform for GPU computing that’s also programming-language independent.

Specifically:

참고URL : https://stackoverflow.com/questions/30622805/opencl-amd-deep-learning

반응형