SDK Intel® FPGA pour OpenCL™ - Centre d’assistance

Avis d’abandon de produits

Intel abandonne Intel® FPGA SDK pour OpenCL.™ Vous trouverez plus d’informations dans la notification d’abandon de produit (PDN2219).

La page d’assistance du Kit de développement logiciel (SDK) Intel® FPGA pour OpenCL fournit des informations sur la façon d’émuler, de compiler et de profiler votre noyau. Il existe également des directives sur la façon d’optimiser votre noyau ainsi que des informations sur la façon de déboguer votre système lors de l’exécution de l’application hôte. Cette page est organisée en deux catégories principales basées sur la plateforme de développement : développeur de noyau pour FPGA et développeur de code hôte pour les processeurs.

Configuration logicielle requise

Vous devez disposer de privilèges d’administrateur sur le système de développement pour installer les packages et pilotes nécessaires au développement du logiciel hôte.

Le système hôte doit exécuter l’un des systèmes d’exploitation Windows* et Linux* pris en charge suivants répertoriés sur la page Support du système d’exploitation .

Développez votre application hôte pour le Kit de développement logiciel (SDK) Intel® FPGA pour OpenCL™ à l’aide de l’un des environnements de développement suivants :

Systèmes d’exploitation Windows

SDK Intel FPGA pour OpenCL
Kit de prise en charge de la carte mère (BSP)
Microsoft* Visual Studio Professional version 2010 ou ultérieure.

Systèmes d’exploitation Linux

SDK Intel FPGA pour OpenCL
BSP
RPM (Gestionnaire de paquets RPM ; à l’origine Gestionnaire de paquets Red Hat)
Compilateur C inclus avec GCC
Commande Perl version 5 ou ultérieure

1. Développeur de noyau

Interface utilisateur du SDK

Intel® FPGA SDK pour OpenCL™ offre deux modes d’expérience de développement aux utilisateurs. Pour les constructeurs de code, tous les outils sont intégrés dans l’interface graphique, ce qui leur permet de concevoir, compiler et déboguer le noyau. D’autre part, les options de ligne de commande sont pour les utilisateurs conventionnels.

GUI/générateur de code : Non disponible pour le moment
Option de ligne de commande :

Voici quelques commandes utiles pour les développeurs de noyau :

AOC kernel.cl -o bin/kernel.aocx –board=<board_name>

- Compile kernel.cl fichier source dans un fichier de programmation de FPGA (kernel.aocx) pour la carte spécifiée par <board_name>; -o est utilisé pour spécifier le nom et l’emplacement du fichier de sortie.

AOC kernel.cl -o bin/kernel.aocx –board=<board_name> -march=émulateur

- Construit un fichier aocx pour l’émulation qui peut être utilisé pour tester la fonctionnalité du noyau

AOC -liste-tableaux

- Imprime une liste des cartes et sorties disponibles

AOC - Aide

- Imprime la liste complète des options de commande aoc et des informations d’aide pour chacune de ces options

Version AOCL

- Affiche les informations de version de la version installée de Intel FPGA SDK pour OpenCL

Installation d’AOCL

- Installe les pilotes de votre carte dans le système hôte actuel

Diagnostic de l’AOCL

- Exécute le programme de test du fournisseur de la carte pour la carte

Programme AOC

- Configure une nouvelle image FPGA sur le tableau

Flash AOCL

- Initialise le FPGA avec une configuration de démarrage spécifiée

Aide AOCL

- Imprime la liste complète des options de commande aocl et des informations d’aide pour chacune de ces options

Spécification OpenCL

Compatibilité Khronos

Intel® FPGA SDK pour OpenCL™ est basé sur une spécification Khronos publiée et est pris en charge par de nombreux fournisseurs qui font partie du groupe Khronos. Intel FPGA SDK pour OpenCL a passé avec succès le processus de test de conformité Khronos. Il est conforme à la norme OpenCL 1.0 et fournit les en-têtes OpenCL 1.0 et OpenCL 2.0 du groupe Khronos.

Attention: Le Kit de développement logiciel (SDK) ne prend actuellement pas en charge toutes les interfaces de programmation d’applications (API) OpenCL 2.0. Si vous utilisez les en-têtes OpenCL 2.0 et faites un appel à une API non prise en charge, l’appel renvoie un code d’erreur pour indiquer que l’API n’est pas entièrement prise en charge.

Le runtime hôte Intel FPGA SDK for OpenCL est conforme à la couche et à l’API de plateforme OpenCL, avec quelques précisions et exceptions, que vous trouverez dans la section Support Statuses of OpenCL Features (États de prise en charge des fonctionnalités OpenCL ) du Guide de programmation du SDK Intel FPGA pour OpenCL.

Autres liens connexes :

Pour plus d’informations sur OpenCL, consultez la page de présentation OpenCL de Kronos Group .
L’état de conformité actuel se trouve à la page du Programme d’adoption du groupe Kronos .
Pour plus d’informations sur la norme OpenCL 1.0, reportez-vous à La spécification OpenCL de Khronos.

OpenCL Extensions

Canaux (E/S ou noyau)

L’extension de canal Intel® FPGA SDK pour OpenCL™ fournit un mécanisme permettant de transmettre des données aux noyaux et de synchroniser les noyaux avec une efficacité élevée et une faible latence. Utilisez les liens suivants pour plus d’informations sur l’implémentation, l’utilisation et l’émulation des canaux :

Remarque : Si vous souhaitez exploiter les capacités des canaux mais que vous avez la possibilité d’exécuter le programme de votre noyau à l’aide d’autres SDK, implémentez les canaux OpenCL. Pour plus d’informations sur les tuyaux, consultez la section suivante sur les tuyaux.

Tuyaux

Intel FPGA SDK pour OpenCL fournit une prise en charge préliminaire des fonctions de canal OpenCL, qui font partie de la spécification OpenCL version 2.0. Ils fournissent un mécanisme pour transmettre des données aux noyaux et synchroniser les noyaux avec une efficacité élevée et une faible latence.

L’implémentation des pipelines du Kit de développement logiciel Intel FPGA pour OpenCL n’est pas entièrement conforme à la spécification OpenCL version 2.0. L’objectif de l’implémentation du pipeline du SDK est de fournir une solution qui fonctionne de manière transparente sur un autre périphérique conforme à OpenCL 2.0. Pour activer les tuyaux pour Intel FPGA produits, votre conception doit répondre à certaines exigences.

Consultez les liens suivants pour plus d’informations sur l’implémentation des canaux OpenCL :

Émulateur

Dans un flux de conception en plusieurs étapes, vous pouvez évaluer la fonctionnalité de votre noyau OpenCL™ en l’exécutant sur un ou plusieurs périphériques d’émulation sur un hôte Windows* ou Linux* x86-64. La compilation de la conception pour l’émulation prend quelques secondes pour générer un fichier .aocx et vous permet d’itérer sur votre conception plus efficacement sans avoir à passer par les longues heures nécessaires à la compilation complète.

Pour les systèmes Linux, l’émulateur offre un support de débogage symbolique. Le débogage symbolique vous permet de localiser les origines des erreurs fonctionnelles dans le code de votre noyau.

Le lien ci-dessous donne un aperçu du flux de conception des noyaux OpenCL et illustre les différentes étapes pour lesquelles vous pouvez émuler votre noyau.

SDK Intel® FPGA en plusieurs étapes pour le flux de conception OpenCL

La section Emulating and Debugging Your OpenCL Kernel du Guide de programmation contient plus de détails sur les différences entre le fonctionnement du noyau sur le matériel et l’émulation.

Autres liens connexes :

Optimisation

Avec la technologie Intel® FPGA SDK pour OpenCL™ Offline Compiler, vous n’avez pas besoin de modifier votre noyau pour l’intégrer de manière optimale dans une architecture matérielle fixe. Au lieu de cela, le compilateur hors ligne personnalise automatiquement l’architecture matérielle pour répondre aux besoins de votre noyau.

En général, vous devez optimiser un noyau qui cible d’abord une seule unité de calcul. Après avoir optimisé cette unité de calcul, augmentez les performances en mettant à l’échelle le matériel pour remplir le reste de la FPGA. L’empreinte matérielle du noyau est en corrélation avec le temps nécessaire à la compilation matérielle. Par conséquent, plus vous pouvez effectuer d’optimisations avec un encombrement réduit (c’est-à-dire une seule unité de calcul), plus vous pouvez effectuer de compilations matérielles dans un laps de temps donné.

Optimisation OpenCL pour Intel FPGAs

Pour optimiser la mise en œuvre de votre conception et obtenir les performances maximales, comprenez vos performances maximales théoriques et comprenez quelles sont vos limites. Procédez comme suit :

Commencez par une mise en œuvre fonctionnelle simple et connue.
Utilisez un émulateur pour valider la fonctionnalité.
Supprimez ou minimisez les blocages de pipeline signalés dans le rapport d’optimisation.
Planifiez l’accès à la mémoire pour optimiser la bande passante mémoire.
Utilisez un profileur pour déboguer les problèmes de performances.

Le profileur donne plus d’informations sur les performances du système, ce qui vous donne des indications pour optimiser davantage l’algorithme dans l’utilisation de la mémoire.

N’oubliez pas que pour FPGAs, plus il est possible d’allouer de ressources, plus le déroulement et la parallélisation et les performances sont élevées.

Rapports et ressources utiles pour l’optimisation

Un certain nombre de rapports générés par le système sont mis à la disposition des utilisateurs. Ces rapports donnent un aperçu du code, de l’utilisation des ressources et des conseils sur les points sur lesquels se concentrer pour améliorer encore les performances :

Optimisation de la mémoire

Comprendre les systèmes de mémoire est crucial pour implémenter efficacement une application utilisant OpenCL.

Interconnexion de la mémoire globale

Contrairement à un GPU, un FPGA peut construire n’importe quelle unité de stockage de charge (LSU) personnalisée qui est la plus optimale pour votre application. Par conséquent, votre capacité à écrire du code OpenCL qui sélectionne les types de LSU idéaux pour votre application peut contribuer à améliorer considérablement les performances de votre conception.

Pour plus d’informations, reportez-vous à la section Global Memory Interconnect du SDK Intel FPGA pour obtenir le Guide des meilleures pratiques OpenCL.

Mémoire locale

La mémoire locale est un système complexe. Contrairement à l’architecture GPU typique où il existe différents niveaux de caches, un FPGA implémente la mémoire locale dans des blocs de mémoire dédiés à l’intérieur du FPGA. Pour plus d’informations, reportez-vous à la section Mémoire locale du Guide des meilleures pratiques du Kit de développement logiciel Intel FPGA pour OpenCL.

Il existe plusieurs façons d’optimiser la mémoire utilisée pour améliorer les performances globales. Pour plus d’informations sur certaines des techniques clés, reportez-vous à la section Allocation de mémoire alignée du guide des meilleures pratiques du SDK Intel FPGA pour OpenCL.

Pour plus d’informations sur les stratégies visant à améliorer l’efficacité d’accès à la mémoire, reportez-vous à la section Stratégies d’amélioration de l’efficacité d’accès à la mémoire du Guide des meilleures pratiques du SDK Intel FPGA pour OpenCL.

Pipelines

Il est essentiel de comprendre les pipelines pour tirer parti des meilleures performances de votre implémentation. L’utilisation efficace des pipelines améliore directement le rendement des performances. Pour plus d’informations, reportez-vous à la section Pipelines du guide des meilleures pratiques du SDK Intel FPGA pour OpenCL.

Pour plus d’informations sur le transfert de données, reportez-vous à la section Transfert de données via Intel FPGA SDK pour les canaux OpenCL ou les canaux OpenCL du Guide des meilleures pratiques du SDK Intel FPGA pour OpenCL.

Décrochage, occupation, bande passante

Profilez votre noyau pour identifier les goulots d’étranglement des performances. Pour plus d’informations sur la façon dont les informations de profilage vous aident à identifier les mauvais comportements de mémoire ou de canal qui conduisent à des performances de noyau insatisfaisantes, reportez-vous à la section Profilage de votre noyau pour identifier les goulots d’étranglement des performances du Guide des meilleures pratiques du SDK Intel FPGA pour OpenCL.

Optimisation de la boucle

Voici quelques techniques d’optimisation des boucles :

Pour obtenir des conseils sur la suppression des dépendances portées par boucle dans divers scénarios pour un noyau d’élément de travail unique, reportez-vous à la section Suppression de la dépendance portée par boucle du Guide des meilleures pratiques du Kit de développement logiciel (SDK) Intel FPGA pour OpenCL.

Pour plus d’informations sur l’optimisation des opérations en virgule flottante, reportez-vous à la section Optimisation des opérations en virgule flottante du Guide des meilleures pratiques du Kit de développement logiciel Intel FPGA pour OpenCL.

Optimisation de zone

L’utilisation de zones est une considération de conception importante si vos noyaux OpenCL sont exécutables sur des FPGAs de tailles différentes. Lorsque vous concevez votre application OpenCL, Intel vous recommande de suivre certaines stratégies de conception pour optimiser l’utilisation de la zone matérielle.

L’optimisation des performances du noyau nécessite généralement des ressources FPGA supplémentaires. En revanche, l’optimisation de la zone entraîne souvent une diminution des performances. Lors de l’optimisation du noyau, Intel recommande d’exécuter plusieurs versions du noyau sur la carte FPGA afin de déterminer la stratégie de programmation du noyau qui génère le meilleur compromis entre la taille et les performances.

Pour plus d’informations sur les stratégies d’optimisation de l’utilisation de la zone FPGA, reportez-vous à la section Stratégies d’optimisation de l’utilisation de la zone FPGA du guide des meilleures pratiques du SDK Intel FPGA pour OpenCL.

Exemples de conception de référence

Voici quelques exemples de conception qui illustrent les techniques d’optimisation :

Exemple de conception de multiplication matricielle

Cet exemple montre l’optimisation de l’opération fondamentale de multiplication matricielle en utilisant le pavage de boucle pour tirer parti de la réutilisation des données inhérente au calcul.

Cet exemple illustre :

- Optimisations à virgule flottante simple précision

- Mise en mémoire tampon de la mémoire locale

- Compiler les optimisations (déroulement de boucle, attribut num_simd_work_items)

- Optimisations en virgule flottante

- Exécution de plusieurs appareils

Exemple de conception d’un filtre FIR dans le domaine temporel

Cet exemple de conception met en œuvre le banc d’essai de filtre à réponse impulsionnelle finie (FIR) dans le domaine temporel de HPEC Challenge Benchmark Suite.

Cette conception est un excellent exemple de la façon dont FPGAs peut fournir de bien meilleures performances qu’une architecture GPU pour les filtres FIR à virgule flottante.

Cet exemple illustre :

- Optimisations à virgule flottante simple précision

- Mise en œuvre efficace du tampon de fenêtre coulissante 1D

- Méthodes d’optimisation du noyau à élément de travail unique

Exemple de conception vidéo de réduction d’échelle

Cet exemple de conception met en œuvre un downscaler vidéo qui prend une vidéo d’entrée 1080p et sort une vidéo 720p à 110 images par seconde. Cet exemple utilise plusieurs noyaux pour lire et écrire efficacement dans la mémoire globale.

Cet exemple illustre :

- Canaux du noyau

- Plusieurs noyaux simultanés

- Canaux noyau à noyau

- Modèle de conception de fenêtre coulissante

- Optimisations des modèles d’accès à la mémoire

Exemple de conception de flux optique

Cet exemple de conception est une implémentation OpenCL de l’algorithme de flux optique Lucas Kanade. Une version dense, non itérative et non pyramidale avec une taille de fenêtre de 52x52 est montrée comme fonctionnant à plus de 80 images par seconde sur le kit de développement SoC Cyclone® V.

Cet exemple illustre :

- Noyau à élément de travail unique

- Modèle de conception de fenêtre coulissante

- Techniques de réduction de l’utilisation des ressources

- Sortie visuelle

Formation

Une formation en ligne spécifique à l’optimisation OpenCL avec des exemples de conception est disponible à l’adresse suivante :

Références

Guide des bonnes pratiques Intel FPGA SDK pour OpenCL

Profilage

Dans un flux de conception en plusieurs étapes, si les performances estimées du noyau issues de l’émulation sont acceptables, vous pouvez choisir de collecter des informations sur les performances de votre conception lors de l’exécution sur le FPGA.

Vous pouvez demander au compilateur hors ligne Intel® FPGA pour OpenCL™ d’instrumenter les compteurs de performance dans le code Verilog du fichier .aocx avec l’option -profile. Pendant l’exécution, le SDK Intel FPGA pour OpenCL Profiler mesure et rapporte les données de performances collectées pendant l’exécution du noyau OpenCL sur le FPGA. Vous pouvez ensuite consulter les données de performances dans l’interface graphique de Profiler.

La section Profilage de votre noyau OpenCL du Guide de programmation du Kit de développement logiciel Intel FPGA pour OpenCL contient plus d’informations sur le profil de votre noyau.

Comment analyser les données de profilage

Les informations de profilage vous aident à identifier les mauvais comportements de mémoire ou de canal qui conduisent à des performances de noyau insatisfaisantes. La section Profiler votre noyau pour identifier les goulots d’étranglement des performances du guide des meilleures pratiques du SDK Intel FPGA pour OpenCL contient des informations plus détaillées sur l’interface graphique de Dynamic Profiler et sur la façon d’interpréter les données de profilage telles que le décrochage, la bande passante, les accès au cache, etc. Il contient également une analyse Profiler de plusieurs exemples de scénarios de conception OpenCL.

2. Développeur de code hôte

Bibliothèques hôtes d’exécution

Intel® FPGA SDK pour OpenCL fournit un compilateur et des outils vous permettant de créer et d’exécuter des applications OpenCL™ qui ciblent des produits Intel FPGA.

Si vous avez uniquement besoin de la fonctionnalité de déploiement du noyau Intel FPGA SDK pour OpenCL, téléchargez et installez l’environnement d’exécution Intel FPGA (RTE) pour OpenCL.

Le RTE est un sous-ensemble du SDK Intel FPGA pour OpenCL. Contrairement au Kit de développement logiciel (SDK), qui fournit un environnement permettant le développement et le déploiement de programmes du noyau OpenCL, le RTE fournit des outils et des composants d’exécution qui vous permettent de générer et d’exécuter un programme hôte, et d’exécuter des programmes du noyau OpenCL précompilés sur les cartes d’accélération cibles.

N’installez pas le Kit de développement logiciel (SDK) et le RTE sur le même système hôte. Le SDK contient déjà le RTE.

Utilitaires et bibliothèques d’exécution hôte

Le RTE pour OpenCL fournit des utilitaires, des bibliothèques d’exécution hôte, des pilotes et des bibliothèques et fichiers spécifiques à RTE.

L’utilitaire RTE inclut des commandes que vous pouvez appeler pour effectuer des tâches de haut niveau. Les utilitaires RTE sont un sous-ensemble du SDK Intel FPGA pour les utilitaires OpenCL
Le runtime hôte fournit l’API de plateforme hôte OpenCL et l’API d’exécution pour votre application hôte OpenCL

Le runtime hôte se compose des bibliothèques suivantes :

Les bibliothèques liées statiquement fournissent des API hôtes OpenCL, des abstractions matérielles et des bibliothèques d’assistance
Les bibliothèques de liens dynamiques (DLL) fournissent des abstractions matérielles et des bibliothèques d’assistance

Pour plus d’informations sur les utilitaires et les bibliothèques d’exécution hôte, reportez-vous à la section Contenu de Intel FPGA RTE pour OpenCL du Guide de démarrage de Intel FPGA RTE pour OpenCL .

Streaming de données (canal hôte)

Vous pouvez désormais réduire considérablement la latence de vos systèmes à l’aide de canaux hôtes qui permettent de transmettre des données en flux continu depuis l’hôte pour les diffuser directement dans le noyau FPGA via l’interface PCIe*, tout en contournant le contrôleur mémoire. Le noyau FPGA peut commencer à traiter les données immédiatement et n’a pas à attendre la fin du transfert de données. Les canaux hôtes sont pris en charge dans les interfaces de programmation d’applications (API) d’exécution OpenCL et incluent la prise en charge de l’émulation.

Pour plus de détails sur les canaux hôtes et la prise en charge de l’émulation, reportez-vous à la section Émulation des canaux d’E/S du Guide de programmation du Kit de développement logiciel Intel® FPGA pour OpenCL™.

Profilling

Le profilage vous permet d’apprendre où votre programme a passé son temps et quelles sont les différentes fonctions qui sont appelées. Ces informations vous indiquent quelle partie de votre programme s’exécute plus lentement que prévu et qui pourrait nécessiter une réécriture pour une exécution plus rapide du programme. Il peut également vous indiquer quelles fonctions sont appelées plus ou moins souvent que prévu.

Le gprof est un outil open-source disponible dans les systèmes d’exploitation Linux* pour profiler le code source. Il fonctionne sur l’échantillonnage basé sur le temps. Pendant les intervalles, le compteur de programme est interrogé pour décider à quel point du code l’exécution est arrivée.

Pour utiliser le gprof, recompilez le code source à l’aide de l’indicateur de profilage du compilateur -pg

Exécutez les exécutables pour générer les fichiers contenant les informations de profilage :

Un fichier spécifique nommé « gmon.out » contenant toutes les informations dont l’outil gprof a besoin pour produire des données de profilage lisibles par l’homme est généré. Alors, utilisez maintenant l’outil gprof de la manière suivante:

$ gprof code source gmon.out > profile_data.txt

profile_data.txt est le fichier qui contient les informations que l’outil GPROF utilise pour produire des données de profilage lisibles par l’homme. Il contient deux parties : le profil plat et le graphique d’appel.

Le profil plat indique combien de temps votre programme a passé dans chaque fonction, et combien de fois cette fonction a été appelée.

Le graphique d’appel indique, pour chaque fonction, quelles fonctions l’ont appelée, quelles autres fonctions elle a appelées et combien de fois. Il existe également une estimation du temps passé dans les sous-programmes de chaque fonction.

Plus d’informations sur l’utilisation de gprof pour le profilage sont disponibles sur le site Web de GNU.

Amplificateur VTune™ Intel®

L’amplificateur de® VTune™Intel utilisé pour le profilage vous aide à accélérer et à optimiser l’exécution de votre code sur les plateformes embarquées Linux, les systèmes Android* ou Windows*, en fournissant les types d’analyse suivants :

Analyse des performances : Trouvez les goulots d’étranglement du code série et parallèle, analysez les choix d’algorithmes et l’utilisation du moteur GPU, et comprenez où et comment votre application peut bénéficier des ressources matérielles disponibles
Analyse Intel Energy Profiler : Analyser les événements de puissance et identifier ceux qui gaspillent de l’énergie

Pour plus d’informations sur Intel V-tune Amplifier, visitez le site Web Mise en route avec Intel VTune Amplifier 2018 pour Linux OS .

Multithreading

OpenCL™ Host Pipelined Multithread fournit un cadre permettant d’atteindre un débit élevé pour les algorithmes où un grand nombre de données d’entrée doivent être traitées et le traitement de chaque donnée doit être effectué dans l’ordre séquentiel. L’une des meilleures applications de ce framework réside dans les plates-formes hétérogènes où du matériel ou une plate-forme à haut débit est utilisé pour accélérer la partie la plus fastidieuse de l’application. Les parties restantes de l’algorithme doivent être exécutées dans un ordre séquentiel sur d’autres plates-formes telles que les processeurs, soit pour préparer les données d’entrée pour la tâche accélérée, soit pour utiliser la sortie de cette tâche pour préparer la sortie finale. Dans ce scénario, bien que les performances de l’algorithme soient partiellement accélérées, le débit total du système est beaucoup plus faible en raison de la nature séquentielle de l’algorithme d’origine.

Dans cette note AN 831: Intel FPGA SDK for OpenCL Host Pipelined Multithread Application Note, un nouveau cadre en pipeline pour la conception à haut débit est proposé. Ce cadre est optimal pour le traitement de données d’entrée volumineuses via des algorithmes où la dépendance aux données force l’exécution séquentielle de toutes les étapes ou tâches de l’algorithme.

FPGA Initiailisation à partir de l’hôte

FPGAs sont très utilisés dans l’espace d’accélération. OpenCL a une façon spécifique d’être utilisé par le CPU pour décharger la tâche sur FPGA. Le fichier ci-dessous contient les étapes d’initialisation courantes nécessaires au code hôte pour lancer le noyau FPGA. Téléchargez le fichier contenant les étapes d’initialisation ici.

La fonction init() peut être appelée à partir de la fonction main() pour initialiser le FPGA. Le code trouve d’abord le périphérique sur lequel le noyau s’exécutera, puis le programme avec l’aocx fourni dans le même répertoire que l’exécutable hôte. Après les étapes d’initialisation du code, l’utilisateur doit définir les arguments du noyau en fonction des besoins de ses conceptions.

Il existe également une fonction cleanup() qui libère les ressources après l’exécution du noyau.

3. Débogage

Émulation

Le SDK Intel® FPGA pour l’émulateur OpenCL™ peut être utilisé pour vérifier la fonctionnalité du noyau. L’utilisateur peut également déboguer la fonctionnalité du noyau OpenCL dans le cadre de l’application hôte sur les systèmes Linux*. La fonctionnalité de débogage fournie avec l’émulateur Intel FPGA SDK for OpenCL vous permet de le faire.

Pour plus d’informations, reportez-vous aux sections suivantes dans le Guide de programmation du SDK Intel FPGA pour OpenCL :

Profilage

Pour plus d’informations sur le profilage, reportez-vous aux sections suivantes dans le Guide de programmation du Kit de développement logiciel (SDK) Intel® FPGA pour OpenCL™ :

Variables de débogage du runtime
Certaines variables d’environnement peuvent être définies pour obtenir davantage d’informations de débogage lors de l’exécution de l’application hôte. Il s’agit Intel® FPGA variables d’environnement spécifiques au SDK pour OpenCL™, qui peuvent aider à diagnostiquer les problèmes liés aux conceptions de plateforme personnalisées. Le tableau suivant répertorie toutes ces variables d’environnement et les décrit en détail.
Titre de la variable d’environnement	Description
ACL_HAL_DEBUG	Définissez cette variable sur une valeur comprise entre 1 et 5 pour augmenter la sortie de débogage de la couche d’abstraction matérielle (HAL), qui s’interface directement avec la couche MMD.
ACL_PCIE_DEBUG	Définissez cette variable sur une valeur comprise entre 1 et 10 000 pour augmenter la sortie de débogage à partir de la MMD. Ce paramètre de variable est utile pour confirmer que le registre d’ID de version a été lu correctement et que les cœurs IP UniPHY sont calibrés.
ACL_PCIE_JTAG_CABLE	Définissez cette variable pour remplacer l’argument quartus_pgm par défaut qui spécifie le numéro de câble. La valeur par défaut est le câble 1. S’il existe plusieurs câbles Intel® FPGA téléchargement, vous pouvez spécifier un câble particulier en définissant cette variable.
ACL_PCIE_JTAG_DEVICE_INDEX	Définissez cette variable pour remplacer l’argument quartus_pgm par défaut qui spécifie l’index de périphérique FPGA. Par défaut, cette variable a la valeur 1. Si le FPGA n’est pas le premier périphérique de la chaîne JTAG, vous pouvez personnaliser la valeur.
ACL_PCIE_USE_JTAG_PROGRAMMING	Définissez cette variable pour forcer le MMD à reprogrammer le FPGA à l’aide du câble JTAG au lieu d’une reconfiguration partielle.
ACL_PCIE_DMA_USE_MSI	Définissez cette variable si vous souhaitez utiliser MSI pour les transferts d’accès direct à la mémoire (DMA) sur le système d’exploitation Windows*.

Tout voir Voir moins

Outil de diagnostic pour Intel® FPGA SDK pour OpenCL™

L’outil de diagnostic de Intel FPGA SDK pour OpenCL permet de diagnostiquer et de résoudre divers problèmes d’installation/de configuration ainsi que des problèmes matériels et logiciels qui surviennent lors de l’utilisation d’Intel FPGA SDK pour OpenCL. L’outil effectue des tests d’installation, des tests de périphériques et des tests de liaison. Pour plus d’informations sur l’outil, reportez-vous à cette présentation. Pour utiliser l’outil, téléchargez-le ici.

Autres techniques de débogage

En raison d’une boucle dans le programme hôte, les utilisateurs peuvent constater que le système OpenCL™ ralentit pendant son exécution. Pour en savoir plus sur un tel scénario, reportez-vous à la section Débogage de votre système OpenCL qui ralentit progressivement du Guide de programmation du SDK Intel® FPGA pour OpenCL.

Intel Code Builder for OpenCL est un outil de développement logiciel disponible dans le cadre du SDK Intel FPGA pour OpenCL. Il fournit un ensemble de plug-ins Microsoft* Visual Studio et Eclipse qui permettent de créer, de construire, de déboguer et d’analyser des applications Windows* et Linux* accélérées par OpenCL. Pour plus d’informations, reportez-vous à la section Développement/débogage d’applications OpenCL à l’aide d’Intel Code Builder for OpenCL du Guide de programmation du SDK Intel FPGA pour OpenCL.

Solution de base de connaissances

Intel® Arria® 10 périphériques

Rechercher dans la base de connaissances (OpenCL)™

Intel® Stratix® 10 périphériques

Rechercher dans la base de connaissances (OpenCL)

FPGA Articles de la base de connaissances
Erreur : échec de l’affirmation dans /XXX/llvm/lib/Transforms/FPGATransforms/TransformPrintf.cpp(715)
Erreur : périphérique inconnu partie 1SG280LU2F50E2VG
Erreur de segmentation dans le acl_event_is_valid () utilisant clEnqueueFIllBufer()
**Erreur:./.. /.. /ip/kernel_system/kernel_system_sys_description_rom/acl_rom_module_10/sim/acl_rom_module.v(77): Module 'acl_reset_handler' n’est pas défini.
MLAB disponible dans le rapport OpenCL est 0
Puis-je utiliser les scripts de synthèse ASIC du compilateur de conception Synopsys (DC) existants pour FPGA synthèse dans le logiciel DC FPGA ?
Intel® Stratix® kit de développement FPGA 10 GX peut-il prendre en charge PCIe gen3x16 pour OpenCL ?
Erreur du compilateur : Appel de fonction non reconnu : acl.external.iowr
Erreur du compilateur : argument dans 'constant' L’espace d’adressage ne peut pas être stocké dans une mémoire globale hétérogène.
Compilation d’un noyau OpenCL à l’aide des options de commande du SDK --profile et -g0 Intel FPGA pour le compilateur hors ligne OpenCL Ne supprime pas le code source du fichier .aocx
La routine printf du kit de développement logiciel (SDK) du processeur Nios™ embarqué prend-elle en charge les types de données à virgule flottante ?
L’émulation d’une conception OpenCL peut consommer toutes les ressources du processeur et provoquer une erreur fatale
Erreur (13224) : erreur Verilog HDL ou VHDL à . V : Les p_avm_printf_addrhello_world_enable de port ANSI ne peuvent pas être redéclarés
Erreur (16045) : instance « ccip_std_afu\|bsp_logic_inst\|board_inst » instancie l’entité non définie « carte » Fichier
Erreur (16045) : instance « ccip_std_afu\|bsp_logic_inst\|board_inst » instancie l’entité non définie « carte » Fichier : /home/anchen/Downloads/dla/build/dla/build/bsp_logic.sv Ligne : 133
Erreur (16045) : instance « ccip_std_afu\|bsp_logic_inst\|board_inst » instancie l’entité non définie « carte » Fichier : /home/anchen/Downloads/dla/build/dla/build/bsp_logic.sv Ligne : 133
Erreur (18212) : Impossible de charger l’instantané final pour la partition « root_partition »
Erreur (18590) : la netlist importée contient des paramètres qui ne sont pas pris en charge par la version actuelle du logiciel.
Erreur (213009) : Nom du fichier « output_files/afu_import.green_region.pmsf » n’existe pas ou ne peut pas être lu
Erreur (297008) : impossible de créer un répertoire de base de données pour le projet dans le répertoire du projet
Erreur (XXXXX) : Impossible de générer le fichier Atom Netlist car la famille Stratix 10 n’est pas installée
Erreur (XXXXX) : Impossible de générer le fichier Atom Netlist car la famille Stratix 10 n’est pas installée
Message d’erreur : » Erreur : Optimizer FAILED -dbg-info-enabled --grif --soft-elementary-math=false --fas=false --wiicm-disable=true « kernel_top.1.bc » -o « kernel_top.kwgid.bc »
Erreur : Impossible de trouver la plateforme Intel(R) FPGA OpenCL
Erreur : » X Erreur de l’échec de la demande : BadValue »
Erreur : alt_pr.avmm_slave (0x0.. 0x3f) est en dehors de la plage d’adresses du maître (0x0.. 0x7)
Erreur : aoc : Le compilateur Intel(R) Kernel Builder for OpenCL(TM) (ioc64) est introuvable
erreur : aocl_opt : trop d’arguments positionnels spécifiés. Peut spécifier au maximum 1 arguments positionnels
Erreur : échec de l’assertion dans /XXX/llvm/lib/Analysis/FPGAAnalysis/MemoryAccessAnalysis.cpp(1537)
Erreur : Échec de l’affirmation au niveau d’ACLMemUtils.cpp(510)
Erreur : board.pipe_stage_host_ctrl.m0 : alt_pr.avmm_slave ne peut pas être au 0xcfb0 (0xcf80 ou 0xcfc0 sont acceptables)
Erreur : board.pipe_stage_host_ctrl.m0 : version_id.s (0xcfc0.. 0xcfc3) chevauche alt_pr.avmm_slave (0xcfb0.. 0xcfef)
Erreur : impossible de trouver board_env.xml dans l’emplacement BSP
ERREUR : CL_INVALID_KERNEL_NAME
Erreur : Impossible de trouver le rapport d’ajustement afu_opencl_kernel.fit.rpt dans le répertoire de compilation
Erreur : échec de l’énumération des périphériques
Erreur : fonction 'read_channel_altera' n’est pas pris en charge par le SDK Intel(R) FPGA pour OpenCL(TM) et aucune définition d’utilisateur n’est fournie
Erreur : fonction 'write_channel_altera' n’est pas pris en charge par le SDK Intel(R) FPGA pour OpenCL(TM) et aucune définition d’utilisateur n’est fournie
Erreur : ip-generate FAILED (La génération de ip) a échoué
Erreur : kernel_mem_mm_bridge_0 : deviceFamily » Arria 10 » est hors de portée : » Cyclone 10 GX », » Aucune », » Inconnu »
Erreur : kernel_mem_mm_bridge_0 : deviceFamily » Arria 10 » est hors de portée : » Cyclone 10 GX », » Aucune », » Inconnu »
Erreur : Rappel de notification OpenCL : La taille globale du travail dans une dimension dépasse les limites du périphérique Échec du lancement du noyau
Erreur : Rappel de notification OpenCL : La taille globale du travail dans une dimension dépasse les limites du périphérique Échec du lancement du noyau
ERREUR : échec de l’exécution de l’outil de dépannage
Erreur : redéfinition de 'filter_coeffs' constant int filter_coeffs[2 * 2 * 2 * 2 * FILTER_TAPS] = {
Erreur : échec de l’intégrateur système
ERREUR : Impossible de trouver Altera plate-forme OpenCL
ERREUR : Impossible de trouver la plateforme Intel® FPGA OpenCL pendant l’émulation
erreur : Utilisation inattendue de la ou des fonctions de la bibliothèque HDL (peut-être due à la prise de l’adresse de la fonction) !
Erreur : argument inconnu : '--fmax=300'
Erreur : périphérique inconnu, pièce 10AX115S2F45I1SG
Erreur : périphérique inconnu, pièce 10AX115S2F45I1SG
Erreur : périphérique inconnu partie 1SG280LU2F50E2VG
ERREUR : CODE D’ERREUR NON RECONNU (-1001), emplacement : .. /common/src/AOCLUtils/opencl.cpp:297, Échec de la requête pour le nombre de plates-formes
Erreur : échec de la WDC_PCiScanDevices
export ACL_QSH_COMPILE_CMD="quartus_sh --flow recompile top -c flat » ne fonctionne pas dans la version 17.0
Canaux d’E/S externes non disponibles sur les plateformes personnalisées portées à partir de la plateforme de référence réseau Altera Stratix V
Pour MAX 10 conceptions, le logiciel Quartus II pose » Erreur (125095) : Nom de la pièce... invalide » et » Erreur (281000) : Nom de la pièce... illégal » Erreurs
Les transferts de mémoire hôte à appareil dépassant 8 Ko peuvent provoquer une erreur irrécupérable dans la version Windows de la plate-forme de référence du kit de développement FPGA Altera Arria 10 GX
Comment programmer le flash non volatile si la commande Intel® SDK pour OpenCL™ « aocl program » provoque le redémarrage de l’ordinateur ?
Comment compiler un noyau OpenCL en utilisant la dernière version du Intel® SDK pour OpenCL™ avec un Board Support Package (BSP) d’une version précédente ?
Comment utiliser la fonction OpenCL clReleaseEvent pour éviter les fuites de mémoire ?
Comment déterminer le nombre de cartes FPGA incluses dans le système ?
Comment gérer l’élément AVALON_MEM de la bibliothèque OpenCL ?
L’installation d’un pilote non signé peut provoquer une erreur dans le SDK Altera pour OpenCL exécuté le Windows 8.1
Intel FPGA des restrictions de dénomination du noyau OpenCL
Intel FPGA SDK pour OpenCL version 17.0 ne prend pas en charge les systèmes d’exploitation Ubuntu
Erreur du compilateur interne : informations de cycle de démarrage manquantes pour le nœud interrogé : sync_out
Erreur interne : sous-système : QHD, fichier : /quartus/comp/qhd/qhd_database_model_utils.cpp
Erreur interne : Sous-système : QSYM, Fichier : /quartus/ccl/qsym/qsym_namespace.cpp, Ligne : 264 La table des chaînes pour 43 est 5844 (ID : 721426136, Symbole : 5848)
Erreur interne : Sous-système : QSYM, Fichier : /quartus/ccl/qsym/qsym_namespace.cpp, Ligne : 264 La table des chaînes pour 43 est 5844 (ID : 721426136, Symbole : 5848)
Erreur interne : Sous-système : VPR20KMAIN, Fichier : /quartus/fitter/vpr20k/altera_arch_common/altera_arch_re_network_tools.cpp, Ligne : 883
jtagconfig:Aucun matériel JTAG disponible
L’exécution du noyau et le transfert de données en mémoire ne peuvent pas fonctionner simultanément même s’il n’y a pas de dépendance d’événement dans le code hôte
Erreur de l’éditeur de liens : référence non définie à nios_output_memory_access', à config/nios/nios.c:2540
Nios II options du compilateur GCC : -march, -mbmx, -mno-bmx, -mcdx, -mno-cdx
Aucune sortie attendue lors de l’exécution de « aocl env » sur l’émulation fichier AOCX
Exécution automatique du noyau CL pour le mode émulateur
Erreur OpenCL : Les contraintes de routage matérielles pour le signal n’ont pas pu être satisfaites
Erreur OpenCL : ip-generate FAILED (échec de la génération ip)
Technology Map Viewer (Post-Mapping) ne charge pas le schéma de la netlist de conception lors de l’analyse et de la télématique La synthèse est terminée
Impossible de redémarrer l’exécution automatique du noyau sur l’émulateur sur 17.0
Impossible de déverrouiller /intelFPGA_pro/17.1.1/hld/installed_packages
L’utilisation du SDK Altera pour OpenCL version 16.0.1 pour compiler une conception OpenCL qui cible une version 16.0 de la plateforme de référence ou personnalisée Arria 10 entraîne une erreur irrécupérable
Avertissement : veuillez utiliser -board= au lieu de --board
Avertissement : Veuillez utiliser -profile au lieu de --profile
Avertissement : Veuillez utiliser -report au lieu de --report
AVERTISSEMENT : le fichier sélectionné n’a pas le même chemin que le chemin du fichier stocké dans le fichier .aocx ! Peut entraîner des données vierges
Avertissement : xx.cl:x:x : boucle non déroulée : l’optimiseur n’a pas pu effectuer la transformation demandée ; La transformation peut être désactivée ou spécifiée dans le cadre d’un ordre de transformation non pris en charge
Que signifie le mot « conteneur » dans le conteneur report.html pour Intel® FPGA SDK OpenCL™ ?
Lorsque j’exécute nios-debug ou tout autre utilitaire qui utilise la connexion MDI/OCI via la méthode parallel-port direct (alias parport2k), pourquoi est-ce que je vois une boîte de message Échec de chargement du pilote qui empêche toute action ultérieure impliquant le débogage JTAG ?
Où se trouvent les packages de support de carte OpenCL™ (BSP) pour les kits de développement ?
Où installer le fichier FCD (pilote client FPGA) *.fcd à l’aide des outils OpenCL SDK version 17.0 ?
Quelle fonction utiliser lors de la liaison du FCD (pilote client FPGA) à l’application hôte ?
Pourquoi les définitions du SDK Altera OpenCL sont-elles num_vector_lanes et ne num_copies-elles pas dans la documentation 13.0sp1 ?
Pourquoi est-ce que je obtiens de mauvaises performances lors de la compilation d’un exemple de conception vectorielle avec Intel® FPGA SDK pour OpenCL™ ?
Pourquoi est-ce que je reçois Erreur (114016) : Mémoire insuffisante dans le module quartus_syn lors de la compilation d’architectures dans le Intel® FPGA Deep Learning Acceleration Suite ?
Pourquoi est-ce que j’obtiens la ressource disponible différente lors de la compilation de la même conception OpenCL avec différentes versions de Intel® FPGA SDK OpenCL™™ ?
Pourquoi l’erreur « CL_INVALID_ARG_SIZE » s’affiche-t-elle lorsque j’utilise type long long comme argument du noyau OpenCL™ dans le code hôte ?
Pourquoi est-ce que je reçois l’erreur « Aucun matériel JTAG disponible » lors de l’exécution de jtagconfig dans Linux CentOS ou Ubuntu?
Pourquoi l’erreur « Unable to determine the execution environment » s’affiche-t-elle lors de l’exécution de la commande « aocl version » dans le Intel SDK pour OpenCL ?

Tout voir Voir moins

Autres ressources

Voici quelques liens supplémentaires de la communauté Intel FPGA pour des questions spécifiques liées aux étapes de conception et d’exécution :

4. Formation disponible

Formations

Consultez les cours de formation OpenCL™ suivants :

Vidéos rapides OpenCL™
Titre de la vidéo	Description de la vidéo
Comment exécuter Hello World et (autres programmes) avec OpenCL™ sur un SoC Cyclone® V à l’aide de Windows* Partie 1	Cette vidéo décrit la procédure prête à l’emploi pour exécuter deux applications, OpenCL HelloWorld et OpenCL™ fast Fourier transform (FFT) sur le SoC Cyclone® V à l’aide d’une machine Windows*.
Comment exécuter Hello World et (autres programmes) avec OpenCL sur un SoC Cyclone V à l’aide de Windows, partie 2	Cette vidéo décrit la procédure prête à l’emploi pour exécuter deux applications, OpenCL HelloWorld et OpenCL FFT, sur le SoC Cyclone V à l’aide d’une machine Windows.
Comment exécuter Hello World et (Autres programmes) avec OpenCL sur un SoC Cyclone V à l’aide de Windows, partie 3	Cette vidéo décrit la procédure prête à l’emploi pour exécuter deux applications, OpenCL HelloWorld et OpenCL FFT, sur le SoC Cyclone V à l’aide d’une machine Windows.
Comment exécuter Hello World et (autres programmes) avec OpenCL sur un SoC Cyclone V à l’aide de Windows, partie 4	Cette vidéo décrit la procédure prête à l’emploi pour exécuter deux applications, OpenCL HelloWorld et OpenCL FFT, sur le SoC Cyclone V à l’aide d’une machine Windows.
Comment exécuter Hello World et (Autres programmes) avec OpenCL sur Cyclone V SoC à l’aide de Windows Partie 5	Cette vidéo décrit la procédure prête à l’emploi pour exécuter deux applications, OpenCL HelloWorld et OpenCL FFT, sur le SoC Cyclone V à l’aide d’une machine Windows.
Comment empaqueter des modules/conceptions Verilog personnalisés en tant que bibliothèques OpenCL	La vidéo explique pourquoi les clients pourraient potentiellement utiliser cette fonctionnalité pour avoir leurs blocs de traitement personnalisés (RTL) dans le code du noyau OpenCL. La vidéo explique l’exemple de conception, tel que les fichiers makefiles et config, et explique le flux de compilation. La vidéo montre également une démonstration de l’exemple de conception.
OpenCL sur Altera® SoC FPGA (hôte Linux*) – Partie 1 – Téléchargement et configuration des outils	Cette vidéo montre comment télécharger, installer et configurer les outils nécessaires au développement de noyaux OpenCL et de code hôte ciblant Altera® SoC FPGAs.
OpenCL sur Altera SoC FPGA (hôte Linux) – Partie 2 – Exécution de l’exemple d’ajout vectoriel avec l’émulateur	Cette vidéo montre comment télécharger et compiler un exemple d’application OpenCL ciblant l’émulateur intégré à OpenCL.
OpenCL sur Altera SoC FPGA (hôte Linux) – Partie 3 – Compilation de code noyau et hôte pour SoC FPGA	Cette vidéo montre comment compiler le noyau OpenCL et le code hôte ciblant le FPGA et le processeur du FPGA SoC Cyclone V.
OpenCL sur Altera SoC FPGA (hôte Linux) – Partie 4 – Configuration de l’environnement d’exécution	Cette vidéo montre comment configurer la carte SoC Cyclone V pour exécuter l’exemple OpenCL et exécuter le code hôte et le noyau sur la carte.

Tout voir Voir moins

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.

Sélectionnez votre langue

Utiliser la recherche Intel.com

Liens rapides

Recherches récentes

Recherche avancée

Rechercher uniquement dans

SDK Intel® FPGA pour OpenCL™ - Centre d’assistance

Avis d’abandon de produits

Configuration logicielle requise

1. Développeur de noyau

2. Développeur de code hôte

3. Débogage

Variables de débogage du runtime

FPGA Articles de la base de connaissances

4. Formation disponible

Vidéos rapides OpenCL™