banner
Centre d'Information
Service après-vente supérieur

Base de données de fatigue des alliages fabriqués de manière additive

Dec 12, 2023

Données scientifiques volume 10, Numéro d'article : 249 (2023) Citer cet article

784 accès

1 Altmétrique

Détails des métriques

La fatigue est un processus de dégradation mécanique qui est généralement évalué sur la base de règles empiriques et de données expérimentales obtenues à partir d'essais standardisés. Les données de fatigue des matériaux d'ingénierie sont généralement rapportées dans les données SN (la relation contrainte-durée de vie), ε-N (la relation déformation-durée de vie) et da / dN-ΔK (la relation entre le taux de croissance des fissures de fatigue et la gamme de facteurs d'intensité de contrainte). La fatigue et les propriétés mécaniques statiques des alliages fabriqués de manière additive (AM), ainsi que les types de matériaux, les paramètres d'AM, le traitement et les tests sont collectés à partir de milliers d'articles scientifiques jusqu'à la fin de 2022 en utilisant le traitement du langage naturel, l'apprentissage automatique et les techniques de vision par ordinateur. Les résultats montrent que les performances des alliages AM pourraient atteindre celles des alliages conventionnels bien que la dispersion des données et la déviation du système soient présentes. La base de données (FatigueData-AM2022) est formatée en structures compactes, hébergée dans un référentiel ouvert et analysée pour montrer leurs modèles et statistiques. La qualité des données recueillies à partir de la littérature est mesurée en définissant des scores d'évaluation pour les ensembles de données rapportés dans des études individuelles et par les taux de remplissage des entrées de données dans tous les ensembles de données. La base de données sert également d'ensemble de formation de haute qualité pour le traitement des données à l'aide de modèles d'apprentissage automatique. Les procédures d'extraction et d'analyse des données sont décrites et les outils sont rendus publics. Un langage unifié des données sur la fatigue est suggéré pour réglementer la communication des données sur la performance à la fatigue des matériaux afin de faciliter le partage des données et le développement de la science ouverte.

La fatigue est un processus préjudiciable de dégradation mécanique subi par les matériaux de structure et les composants en service à long terme dans, par exemple, l'aérospatiale, l'énergie nucléaire, l'industrie pétrolière et gazière1. La conception de l'intégrité structurelle avec les dommages de fatigue pris en compte peut être effectuée selon les principes de la sécurité de la vie ou de la tolérance aux dommages. Dans la conception de durée de vie sûre, les défauts ne sont pas explicitement pris en compte et les produits sont destinés à être retirés du service après la durée de vie de conception. La philosophie de conception repose sur des données expérimentales provenant d'éprouvettes standard testées dans des conditions de chargement spécifiques, qui peuvent être étendues aux composants structuraux. En pratique, les spectres de chargement arbitraires sont traités en considérant les dommages cumulés, par exemple en utilisant la règle linéaire de Miner2. Les effets de la taille des éprouvettes, de la contrainte moyenne, de la multiaxialité et de l'environnement peuvent également être inclus. Les données de durée de vie en contrainte (SN) produites par des tests contrôlés par contrainte (contrôlées par la force) et les données de durée de vie en déformation (ε-N) par des tests contrôlés par contrainte sont les deux ensembles fondamentaux de données expérimentales pour la conception de durée de vie sûre, qui décrivent la relation entre le maximum (σmax, εmax) ou l'amplitude (σa, εa) de contrainte/déformation et le nombre de cycles de chargement (N) et sont couramment utilisées pour la conception de fatigue polycyclique (HCF)/fatigue oligocyclique (LCF), respectivement (Fig. 1a). Dans la conception de tolérance aux dommages, un composant structurel est considéré comme capable de supporter des défauts (par exemple des fissures) en toute sécurité avant le prochain point d'inspection, et le composant est ensuite réparé ou remplacé2. La croissance des fissures de fatigue (FCG) peut être rationalisée dans la théorie de la mécanique de la rupture et évaluée expérimentalement à l'aide d'éprouvettes à tension compacte (CT). La dépendance du taux de FCG (da / dN) à la plage du facteur d'intensité de contrainte (SIF) (ΔK) est ainsi évoquée dans la surveillance et la maintenance de la santé structurelle (Fig. 1a). Les données SN, ε-N et da/dN-ΔK offrent des mesures standard pour la dégradation de la résistance mécanique sous des charges cycliques, ce qui est une caractéristique unique qui peut être exploitée dans la recherche centrée sur les données.

Conception de l'intégrité de la structure des composants structuraux de fabrication additive (AM) à l'aide de données de fatigue provenant d'essais normalisés. (a) Conditions de chargement représentatives, types d'éprouvettes et données obtenues à partir d'essais de fatigue. ( b ) Procédures et paramètres de la FA illustrés par la technique de fusion laser sur lit de poudre (L-PBF).

Par rapport au module de Young et à la résistance à la traction, la performance à la fatigue des matériaux est sensible à leurs microstructures, aux conditions de surface ainsi qu'aux charges et aux conditions environnementales2,3. Le processus de fatigue implique une évolution microstructurale des échelles nano, micro à structurelle, et la prédiction théorique de la performance reste difficile4. Les bases de données de fatigue deviennent ainsi d'une importance cruciale pour la conception des structures. Le lancement du programme d'intégrité structurelle des aéronefs (ASIP) dans les années 1950 a permis d'obtenir un grand succès dans la prévention des défaillances catastrophiques et la prolongation de la durée de vie des composants structurels. Cependant, seules quelques bases de données sont rendues publiques, généralement par des instituts de recherche faisant autorité pour les alliages conventionnels, et sont limitées dans les types de matériaux et le nombre d'enregistrements de données. Par exemple, le manuel de développement et de normalisation des propriétés des matériaux métalliques (MMPDS) comprend 213 chiffres SN, 15 ε-N et 39 da/dN-ΔK pour 62 types de matériaux métalliques, dont l'utilisation est acceptée par la Federal Aviation Administration (FAA), le ministère de la Défense (DoD) et la National Aeronautics and Space Administration (NASA)5. La fiche de données sur la fatigue de l'Institut national des sciences des matériaux (NIMS) créée en 1978 au Japon contient 126 feuilles de propriétés de fatigue pour 59 types de matériaux métalliques6.

Les conditions de préparation et d'essai normalisées des éprouvettes suppriment la plupart des sources externes d'incertitudes dans les données de fatigue et conservent une grande partie de la corrélation entre les performances des matériaux et les types de matériaux ainsi que les conditions de charge et environnementales. Cependant, les données de fatigue rapportées montrent toujours une nature très dispersée pour les variations des microstructures des matériaux. D'un point de vue complémentaire, l'analyse statistique de cette nature dispersée basée sur un grand volume de données peut offrir des informations clés sur les performances des matériaux qui ne peuvent être atteintes par d'autres moyens7.

La fabrication additive (AM) est une technique facile pour fabriquer des composants structurels avec une flexibilité dans la conception structurelle et des avantages en termes de coût et de délai8 (Fig. 1b). Le contrôle microstructural offre une excellente voie pour explorer la relation traitement-microstructures-performance (PMP)9,10. Au cours des dernières décennies, des efforts importants ont été faits pour explorer les limites de performance des alliages AM, en particulier sur leurs comportements en fatigue11. Il est bien connu que les conditions de surface, les défauts internes et d'autres caractéristiques microstructurales affectent fortement les performances de fatigue des alliages AM, mais la compréhension de la relation PMP reste largement qualitative12,13. Des approches basées sur la physique-14,15 et sur l'apprentissage automatique (ML)16,17 ont été développées pour résoudre ce problème, qui exige des données de fatigue fiables pour la vérification et la validation du modèle (V&V). Bien que le volume de données soit beaucoup plus petit que celui rapporté pour les alliages produits par des techniques conventionnelles telles que la coulée et le forgeage, des milliers d'articles ont été publiés sur les performances en fatigue des alliages AM, qui fournissent un sous-ensemble complet de données pour l'analyse. Des études récentes ont recueilli et analysé les données de fatigue AM d'alliages AM sélectionnés (par exemple Ti-6Al-4V, AlSi10Mg/AlSi7Mg, 316 L) de la littérature18,19,20,21. Cependant, aucun ensemble de données n'a été publié pour le traitement et l'analyse des données de suivi. De plus, la qualité des résultats résumés est limitée par la portée spécifique des études, et il est nécessaire de disposer de normes ou de normes pour rendre compte de la performance à la fatigue des matériaux.

La science ouverte, y compris la publication ouverte, les données et les ressources connexes, est récemment devenue un consensus mondial pour accélérer la recherche scientifique, promouvoir la collaboration et bénéficier à la communauté22,23. La numérisation et le développement en libre accès offrent des opportunités entièrement nouvelles pour les études centrées sur les données basées sur les données de la littérature, qui peuvent être compilées dans des bases de données structurées et utilisées, par exemple, pour la sélection de matériaux et la conception technique. Par rapport aux données publiées par des institutions faisant autorité, les données ouvertes ont leur richesse dans les microstructures des matériaux et les conditions de test, ce qui peut être utile pour mieux comprendre la corrélation PMP. Cependant, l'hétérogénéité des données est attendue au moins dans la qualité des spécimens d'essai et la conception des essais de fatigue, qui doivent être évalués pour produire des enregistrements fiables. Les articles de revues, les actes de conférence et les rapports techniques forment un vaste corpus d'informations non structurées en croissance constante, qui peut être traité par des techniques de pointe de traitement du langage naturel (TAL), de ML et de vision par ordinateur (CV). Des progrès ont été observés dans cette direction, où des bases de données pour les recettes de synthèse de matériaux24 et les propriétés25,26,27 ont été publiées.

Dans ce travail, nous recueillons des données de fatigue et des données connexes rapportées pour les alliages de FA, notamment le titane, le nickel, l'aluminium et l'acier à partir de 3 415 articles scientifiques (jusqu'à la fin de 2022). Des codes open source et internes sont utilisés pour l'extraction de données à partir de figures, de tableaux et de texte. La description de la recherche et les données SN, ε-N et da/dN-ΔK rapportées sont décrites. Pour illustrer l'utilisation des données, les performances en fatigue des alliages AM sont analysées, offrant des suggestions pour de futures recherches et des publications de données plus efficaces.

Notre flux de travail comprend l'acquisition de contenu (recherche et téléchargement), l'extraction de données (à partir de figures, de tableaux et de texte) et la construction de bases de données (Fig. 2). La base de données contient des métadonnées d'articles et de données scientifiques. Les métadonnées comprennent des informations telles que les auteurs, les agences de financement et l'année de publication, qui décrivent l'histoire du développement, l'état de l'art et la science de la science (SciSci)28. Les données scientifiques décrivent le contenu de la recherche tels que les types de matériaux, les paramètres de FA, le traitement et les essais, la fatigue et les propriétés mécaniques statiques, et leur relation. Les données scientifiques de chaque article sont organisées en ensembles de données de fatigue séparés pour les données SN, ε-N ou da/dN-ΔK.

Flux de travail pour construire la base de données de fatigue des alliages AM. Les articles AM sont recherchés sur le Web of Science (WoS) et accessibles via leurs identifiants d'objet numérique (DOI). Les types de matériaux, les paramètres de FA, le traitement, les essais, ainsi que les propriétés mécaniques statiques et de fatigue sont extraits des figures, des tableaux et du texte, et structurés dans une base de données hiérarchique.

Les articles portant sur la fatigue AM sont identifiés dans les bases de données de citations et le texte intégral est téléchargé auprès des éditeurs. Les mots-clés pour la fatigue AM sont résumés et compilés dans des formules de recherche (tableau 1). En science des matériaux ou en mécanique des matériaux, la « fatigue » couvre généralement les études sur les comportements sous charges cycliques et est utilisée comme mot-clé de recherche. Pour AM, une série de synonymes, de branches et leurs abréviations sont utilisées, selon la terminologie trouvée dans les normes AM29,30 et les articles de revue31,32,33,34,35. La recherche est effectuée dans la base de données de citations faisant autorité, Web of Science Core Collection (WoS), à travers les champs « titre », « résumé » et « mots-clés de l'auteur ». WoS renvoie 3 415 enregistrements d'articles et leurs métadonnées sont obtenues via la fonction "exporter". Un modèle NLP est appliqué pour la classification des articles en fonction de leurs résumés36. Les articles tels que ceux sur la « fatigue » physiologique ou les sujets de recherche dans des domaines non pertinents sont rejetés. Suite à la classification de la PNL et à l'examen manuel, 2 001 articles candidats sont identifiés.

Les identificateurs d'objet numérique (DOI) dans les métadonnées fournissent des liens vers le texte intégral. 104 des 2 001 articles sur la fatigue AM n'ont pas de DOI dans les enregistrements WoS. De plus, 22 articles ne sont pas rédigés en anglais et 27 articles proviennent d'éditeurs ayant moins de 10 publications. Ces enregistrements sont supprimés. 1 848 articles sont téléchargés pour analyse et utilisés pour constituer la base de données. Les études sur les performances en fatigue des alliages de fabrication additive ont commencé après l'an 2000, et la plupart des articles sont publiés à la fois au format de document portable (PDF) et au format langage de balisage extensible (XML)/langage de balisage hypertexte (HTML). Les fichiers PDF et XML/HTML sont plus conviviaux pour l'examen manuel et l'analyse automatisée du code, respectivement. Pour Elsevier, 1 122 PDF d'articles sont récupérés via l'interface de programmation d'application (API), ce qui représente 60 % des articles téléchargés sur la fatigue AM. Les PDF provenant d'autres sources sont récupérés via le code article-downloader37 (24%), Scopus Document Download Manager (12%) ou manuellement depuis les sites des éditeurs (4%). L'API Elsevier permet d'accéder aux fichiers XML (60% d'articles). Les fichiers HTML, s'ils sont disponibles, sont récupérés auprès d'autres éditeurs en utilisant le code article-downloader (37 % d'articles).

Les données de fatigue (SN, ε-N et da/dN-ΔK) présentées sous forme de nuages ​​de points dans les figures ou les entrées dans les tableaux sont extraites et stockées sous forme de paires de données. Les diagrammes de dispersion sont plus lisibles et concis que les tableaux et sont largement adoptés dans la littérature, bien que cette dernière présentation fournisse des valeurs numériques directes. Les figures sont extraites des documents PDF à l'aide de PyMuPDF. Les figures contenant des données de fatigue sont filtrées et celles avec plusieurs tracés sont manuellement segmentées en tracés uniques. Les points de données dispersés sont extraits par un code MATLAB interne IMageEXtractor (IMEX). Le code permet l'extraction automatique et manuelle des données et permet une correction manuelle ultérieure. La fonction d'extraction automatique comprend l'étalonnage des axes, l'analyse des légendes et la reconnaissance des données à l'aide de techniques CV.

Les figures (98 % publiées en couleur) sont prétraitées en images en niveaux de gris et binarisées en utilisant un seuil de niveaux de gris de 80 % pour améliorer l'efficacité du traitement des images dans l'extraction automatique (Fig. 3a). Les versions en couleur, en niveaux de gris et binarisées des figures sont stockées et sélectionnées pour être utilisées dans des conditions spécifiques. Des grappes de pixels noirs connectés dans les images binarisées sont trouvées et stockées en tant que composants de figure (FC). La boîte englobante (BB) d'un FC est définie comme une région rectangulaire définie par ses pixels les plus à gauche, les plus à droite, les plus en haut et les plus en bas (Fig. 3a).

Extraction de données graphiques et textuelles. (a) Les figures de couleur RVB sont converties en niveaux de gris puis en figures binarisées, où des groupes de pixels noirs connectés sont détectés en tant que composants de figure (FC). Leurs boîtes englobantes (BB) sont représentées par des boîtes vertes. (b) Les axes sont détectés dans les figures et les légendes sont analysées pour obtenir les symboles de données et les étiquettes. Les symboles des légendes sont utilisés comme modèles pour la reconnaissance des données. Les cases rouges dans chaque panneau indiquent les objets à reconnaître dans les étapes de traitement des données. (c) Organigramme de la classification et de l'extraction des données textuelles.

L'étalonnage des axes produit les positions des axes, les étiquettes des axes, les échelles des axes, les repères et les étiquettes des repères. Le système de coordonnées xy (CS) constitue le plus grand FC, mesuré par la zone sous son BB. Les axes x et y sont identifiés comme des lignes plus longues que 70 % de la figure en balayant le plus grand FC dans les directions verticale et horizontale. Les lignes perpendiculaires aux axes sont reconnues comme des graduations. Les étiquettes sont extraites par reconnaissance optique de caractères (OCR)38 et affectées aux axes et graduations en fonction de leurs positions. Les échelles des axes (linéaire/log) sont déterminées en fonction de la position et de l'étiquette des graduations.

Les régions de légende sont sélectionnées manuellement dans l'étude en cours car les positions et les dispositions des légendes varient d'une figure à l'autre. Dans la région sélectionnée, les symboles des points de données sont reconnus et stockés en tant que modèles, et les étiquettes de légende sont annotées. Les pixels contenant des points de données dans le CS sont reconnus selon les codes de couleur des modèles. Les données rapportées dans la représentation binarisée sont reconnues à l'aide des formes. Dans 55% des données da/dN-ΔK, les symboles sont densément disposés et leurs formes ne peuvent pas être distinguées. Par conséquent, seuls les pixels extraits à l'aide des codes de couleurs sont stockés. Tous les SN, ε-N et les 45 % restants des données da/dN-ΔK sont extraits en fonction de la couleur et de la forme qui sont cohérentes. Les pixels extraits sont mis en correspondance avec les formes des modèles pour détecter les types de symboles. Les centroïdes de ces symboles sont ensuite extraits sous forme de points de données. La méthode d'extraction des données (« couleur et forme », « couleur » ou « forme ») est enregistrée dans la base de données. Les axes, légendes et données extraits sont visualisés et corrigés manuellement dans IMEX. Les données extraites des figures sont converties d'unités de pixels en unités physiques en fonction de la position et de l'échelle des graduations. Les graduations aux deux extrémités des axes sont choisies comme références pour minimiser l'erreur dans la détermination des emplacements.

La performance de l'extraction de données de figures peut être évaluée par les métriques

où TP désigne le vrai positif ou le nombre de données correctement extraites, FP est le faux positif ou le nombre de données incorrectement extraites, et FN est le faux négatif ou le nombre de données qui ne sont pas extraites. Le score F1 est la moyenne harmonique de la précision et du rappel. Les mesures de l'étalonnage de l'axe, de l'analyse de la légende et de la reconnaissance des données sont résumées dans le tableau 2. Nous constatons que la reconnaissance des données sous-performe l'étalonnage de l'axe et l'analyse de la légende en raison des difficultés techniques d'analyse des points de données qui se chevauchent.

Les données sur la fatigue dans moins de 5 % des articles sont rapportées dans des tableaux. Les tableaux ne sont donc utilisés dans ce travail que pour vérifier les données extraites des figures. Les tableaux contenant les paramètres de la FA, le traitement, les essais ainsi que les propriétés mécaniques statiques et de fatigue sont intéressants, qui peuvent être identifiés à partir des légendes des tableaux. Les tableaux dans les fichiers XML/HTML sont analysés par l'extracteur de tableau39 tandis que ceux intégrés dans les fichiers PDF sont traités manuellement. Les métriques d'évaluation de l'extraction des données du tableau sont résumées dans le tableau 2. Le score F1 est de 60%, ce qui n'est pas élevé puisque les données des alliages non AM ou des données de références externes sont incluses. La combinaison d'informations textuelles lors du traitement des données dans les tables pourrait améliorer les performances.

Le traitement de texte comprend la classification de texte et l'extraction de données (Fig. 3b). Les fichiers texte structurés au format XML/HTML sont traités à l'aide de nos codes d'analyse interne TEXTract (adaptés aux styles standard fournis par les éditeurs) et en combinaison avec les packages Python xml.dom.minidom pour XML et BeautifulSoup pour HTML. Le texte est extrait des fichiers PDF par PDFDataExtractor40 si les fichiers XML/HTML ne sont pas disponibles.

La classification des textes est effectuée pour les résumés et les paragraphes à l'aide de la bibliothèque NLP Simple Transformer. L'approche de préformation BERT robustement optimisée (RoBERTa)36, un modèle amélioré de la représentation d'encodeur bidirectionnel pré-formé à partir de transformateurs (BERT)41, est utilisée pour transformer des séquences de texte en vecteurs d'intégration de résumés ou de paragraphes. Les vecteurs d'intégration sont transmis à un réseau neuronal entièrement connecté avec une couche linéaire et des neurones de sortie correspondant aux étiquettes de classe. Les modèles RoBERTa et de classification sont intégrés dans un module de classification dans Simple Transformer. Le modèle est formé sur des articles de fatigue AM avec l'optimiseur AdamW42 en utilisant une fonction de perte d'entropie croisée et un taux d'apprentissage de 4 × 10−5. La classification des résumés identifie les articles sur la fatigue AM à partir des résultats de recherche de WoS sur la base d'un ensemble de données étiqueté manuellement de 500 résumés, avec des étiquettes de classe de «fatigue AM» et «fatigue non AM». Les paragraphes sont classés en classes 'Méthode' et 'Non-méthode' et transmis à l'extraction de données. Les paragraphes "Méthode" incluent des informations sur les matériaux, les paramètres de FA, le traitement et les tests. L'ensemble de formation composé de 3 350 paragraphes de 82 articles est construit à partir de sections avec les mots-clés 'méthode', 'fabrication', 'processus', 'test' et 'expérience' dans leurs titres. Les ensembles de données abstraits et de paragraphes sont divisés en ensembles de formation/test/validation avec un rapport de 0,8 : 0,1 : 0,1.

Les données comprenant les types de matériaux, les paramètres de FA, le traitement, les tests et les propriétés mécaniques statiques sont extraites du texte. Pour identifier les types de matériaux, la reconnaissance d'entité chimique nommée (NER) de ChemDataExtractor 2.043 est appliquée avec un dictionnaire du nom commercial des alliages, préparé selon MMPDS-175 et la connaissance du domaine. La portée de la reconnaissance des matériaux AM contient des paragraphes de titre, de résumé et de méthode. Pour les entrées de données d'AM, de traitement et de test, les mots-clés sont résumés et organisés en expressions régulières (ER) pour extraire les données des paragraphes « Méthode ». Dans un domaine spécifique tel que la fatigue AM, où les variantes de mots-clés et de modèles de phrases pour les données cibles sont limitées, il est relativement facile de construire les RE. En pratique, une grandeur physique peut être associée à plusieurs entrées de données. Par exemple, les « températures » sont pertinentes pour les spécifications des procédures AM, le traitement thermique et les essais de fatigue. Par conséquent, les données extraites sont affectées à des entrées en fonction de mots-clés définis manuellement dans les phrases actuelles et précédentes, tels que « fabrication » pour les procédures AM, « traitement thermique » pour le traitement thermique et « test » pour les tests de fatigue. Les propriétés mécaniques statiques telles que le module de Young, la limite d'élasticité (YS), la résistance à la traction ultime (UTS) et l'allongement sont identifiées par les RE dans les paragraphes de la « Méthode » et les sections suivantes. Les mesures d'évaluation de la classification des textes et de l'extraction des données sont résumées dans le tableau 2. La classification des résumés et des paragraphes obtient un score F1 supérieur à 80 %. Le score F1 d'extraction de données est de 63%, ce qui n'est pas élevé car il est difficile d'introduire efficacement les informations de contexte dans l'approche RE basée sur des règles. Le traitement des figures, des tableaux et du texte atteint ainsi de bonnes performances dans les tâches de calibration d'axe, d'analyse de légende et de classification de texte. Les performances de l'extraction de données peuvent être améliorées en affinant les règles d'analyse, en utilisant l'analyse des dépendances ou en utilisant des modèles NLP avancés tels que le transformateur pré-formé génératif (GPT). GPT-3 est un grand modèle de langage pré-formé avec 175 milliards de paramètres avec des performances améliorées d'apprentissage en quelques coups44, ce qui réduit le besoin de données spécifiques à la tâche et d'expertise en PNL. Avec un réglage fin, GPT-3 a le potentiel d'extraire des données structurées d'un texte scientifique complexe avec un score F1 > 80 %45. La capacité du GPT-4 est encore plus élevée, en particulier dans les tâches complexes46. Leurs applications aux données de fatigue restent à explorer.

Pour construire la base de données, les données de fatigue extraites des figures doivent être corrélées avec les entrées de données sur les matériaux, la FA, le traitement, les essais et les propriétés mécaniques statiques extraites du texte et des tableaux. La plupart des entrées de données ne varient pas dans les recherches spécifiques rapportées dans un article. Les valeurs uniques extraites pour une entrée de données spécifique sont affectées à tous les ensembles de données liés à l'article. Pour les entrées de données avec plusieurs valeurs, l'affectation est effectuée en fonction des étiquettes de légende.

Contrairement aux propriétés mécaniques statiques, les données de fatigue sont plus sensibles aux conditions de fabrication, de traitement et d'essai, ce qui entraîne une dispersion des données. Par conséquent, bien que les scores F1 d'extraction de données puissent être améliorés en utilisant des techniques avancées, les performances peuvent encore être insuffisantes pour établir des bases de données de haute qualité pour l'analyse de la fatigue en ingénierie. Dans ce travail, nous abordons ce problème par un examen et une correction manuels. Pour les données de fatigue, nous corrigeons d'abord les données à l'aide de notre interface IMEX, puis imprimons les données pour les comparer avec celles des figures sources. Pour les entrées liées aux matériaux, à la FA, au traitement, aux essais et aux propriétés mécaniques statiques, nous exportons les données vers un fichier EXCEL et les comparons avec les fichiers PDF. Outre l'examen et la correction des données, le travail manuel implique également la sélection et la segmentation des figures, ainsi que la sélection des régions de légende. Nous extrayons la taille et la forme des spécimens lors de l'examen manuel car la plupart d'entre eux sont présentés sous forme de figures au lieu de texte. L'examen du texte est la partie dominante du travail manuel, et un expert du domaine peut traiter 4 à 8 articles par heure. Un système automatisé d'annotation et de correction des données multimodales (figures, tableaux et textes) pourrait réduire la charge de travail. La communication normalisée des données, coordonnée par les auteurs, les éditeurs et les utilisateurs des données, peut également faciliter la construction de bases de données.

Dans les tests expérimentaux pour mesurer les données SN et ε-N, l'amplitude (σa ou εa) et la contrainte/déformation maximale (σmax ou εmax) sont utilisées, qui peuvent être liées par

Dans l'étude actuelle, les maxima (35 % de la base de données complète) sont convertis en amplitudes via le rapport de charge

Pour les données da/dN-ΔK, la plage SIF est

Pour l'analyse, les données de fatigue dispersées des relations SN et ε-N sont ajustées en supposant une distribution log-normale avec une variance constante en suivant la norme ASTM E739-1047, c'est-à-dire

où A et B sont les paramètres d'ajustement. La relation SN peut être convertie sous la forme de l'équation de Basquin

où A1 et B1 sont les paramètres d'ajustement.

Les données da/dN-ΔK sont ajustées par l'équation de Paris

où C et m sont les paramètres d'ajustement.

La base de données FatigueData-AM202248 collecte les données expérimentales SN, ε-N et da/dN-ΔK des alliages AM. Les études sur les composants structuraux ou les matériaux architecturés ne sont pas incluses49,50. Les données sont collectées pour les essais de fatigue dans des conditions uniaxiales ou de flexion. Les performances de fatigue sous des charges variables, de torsion et multiaxiales ne sont rapportées que dans quelques études à ce stade et ne sont pas intégrées pour maintenir l'intégrité des données. La base de données FatigueData-AM202248 est disponible sous forme de fichiers MAT (MATLAB), JSON et EXCEL sur https://doi.org/10.6084/m9.figshare.22337629. Les fichiers MAT et JSON sont formatés dans une arborescence hiérarchique. Les nœuds d'arbre qui stockent directement les valeurs de données sont appelés entrées de données. Les entrées de données incluent les types de données chaîne et numérique. Les données textuelles telles que les titres, les types d'AM et les tests de fatigue sont stockées sous forme de chaînes. Les données avec plusieurs chaînes telles que les auteurs, les pays et les institutions sont stockées sous forme de tableaux de chaînes. L'année de publication est définie comme un nombre numérique et d'autres données numériques telles que les données de fatigue, les paramètres de AM et les rapports de charge sont stockées sous la forme de tableaux numériques. Les nœuds d'arbre utilisés pour regrouper les entrées de données sont appelés structures de données. Plusieurs structures telles que des articles ou des ensembles de données de fatigue sont organisées en tableaux de structures. Pour faciliter la mise en œuvre de la programmation et l'acquisition de données, des clés sont définies pour les entrées de données, les structures et les tableaux de structures (Fig. 4 et Tableaux 3–5).

La structure de la base de données FatigueData-AM2022. La base de données FatigueData-AM2022 est formatée dans une structure arborescente hiérarchique. Le nom de chaque nœud de l'arbre est surligné en jaune. Les clés sont définies pour un accès facile par des scripts. Chaque nœud a son type de données spécifique. Deux graphiques circulaires affichent les statistiques des articles téléchargés et les types d'ensembles de données sur la fatigue.

La structure de la base de données FatigueData-AM202248 est résumée à la Fig. 4. Le nœud racine est la base de données, contenant les nœuds enfants des articles et un système d'unités par défaut (par exemple MPa pour la contrainte, °C pour la température, μm pour l'épaisseur de la couche, W pour la puissance). Les données numériques brutes sont converties dans les unités par défaut des entrées de données. Les articles sont stockés sous forme de tableau de structures et chaque article contient deux structures de métadonnées et de données scientifiques. Les métadonnées contiennent des entrées de données telles que les titres et les auteurs des articles. Les données scientifiques stockent un tableau structuré d'ensembles de données de fatigue, dont chacun est obtenu à partir de tests expérimentaux dans différentes conditions. Un jeu de données de fatigue contient 6 structures (fatigue, matériaux, AM, traitement, essais et propriétés mécaniques statiques), sous lesquelles plusieurs entrées de données, structures ou tableaux de structures sont définis (tableau 3). Un score d'évaluation est attribué à chaque ensemble de données sur la fatigue pour mesurer la qualité des données, ce qui sera expliqué dans la section suivante. La structure des paramètres AM et des paramètres de traitement dépend de leur type, comme indiqué dans les tableaux 4 et 5, respectivement. Les paramètres de traitement sont organisés sous la forme d'un tableau struct, 'proc_para', car il peut contenir plusieurs étapes. La séquence de traitement est enregistrée dans le tableau 'proc_seq'. Les paramètres de traitement peuvent être identifiés dans le tableau 'proc_para' via l'entrée d'index dans 'proc_seq'.

La terminologie des types de données est largement héritée de MATLAB (le fichier MAT). Les exceptions sont les tableaux de chaînes et le tableau struct des paramètres de traitement, qui correspondent aux tableaux de cellules dans le fichier MAT. Pour le fichier JSON, la structure est définie comme un dictionnaire et tous les types de tableaux sont définis comme des listes. La base de données FatigueData-AM202248 est également mise à plat dans un fichier EXCEL, comprenant 4 feuilles de travail. Les feuilles de calcul de 'S-N', 'e-N' et 'dadn' stockent respectivement les données SN, ε-N et da/dN-ΔK. Dans ces 3 feuilles de travail, chaque ligne stocke l'index d'un jeu de données de fatigue et un descripteur de données (S/ε, N et le drapeau de déviation pour 'S-N'/'e-N', da/dN et ΔK pour 'dadn'). Les données da/dN-ΔK extraites par couleur stockent tous les pixels correspondants. Le nombre de points de données dépasse le nombre maximal de lignes autorisé par EXCEL (1 048 576). En conséquence, 500 points de données sont échantillonnés à partir de chaque ensemble de données, puis enregistrés. Dans la 4ème feuille de calcul de 'paramètre', chaque ligne stocke l'index d'un jeu de données de fatigue et son contenu. Chaque colonne correspond à une entrée de données. Les données de la feuille de calcul "Paramètres" sont liées aux trois autres par le biais de l'index des ensembles de données de fatigue.

Avec la structure de la base de données décrite ci-dessus, les entrées de données sont expliquées ici en détail. Le tableau 'données de fatigue' stocke N ou ΔK dans la première colonne, et les valeurs de σa, εa ou da/dN dans la deuxième colonne. εa représente l'amplitude de la déformation totale incluant les composants élastiques ou plastiques. La troisième colonne stocke l'indicateur d'épuisement pour les données SN et ε-N, où '1' indique que le test s'arrête avant l'échec (épuisement) et '0' indique l'échec. La durée de vie en fatigue et le taux de FCG sont sensibles à l'anisotropie du matériau. Dans ce travail, la direction des éprouvettes est mesurée par un angle entre la plate-forme du bâtiment en AM et la direction de chargement51. L'effet de taille des spécimens AM pourrait être important en raison de la précision limitée de l'impression, de la présence de défauts et de la contrainte résiduelle52,53,54. La taille de la section critique stocke le diamètre pour les spécimens à sections circulaires, les diamètres extérieur et intérieur pour ceux à sections annulaires, et la largeur et l'épaisseur pour ces sections rectangulaires, respectivement. Les formes des sections sont stockées dans la description des éprouvettes ('spec_desc'). Dans les tableaux numériques des autres entrées de données, une seule valeur représente une valeur spécifique ou la moyenne, et deux valeurs représentent respectivement la limite inférieure et supérieure.

Pour faciliter la comparaison entre les données de chaîne, une nomenclature unifiée est utilisée pour les entrées de données telles que les types de FA, les matériaux, les machines, les affiliations et les agences de financement. 98% des types AM peuvent être classés en quatre catégories de fusion laser sur lit de poudre (L-PBF), fusion sur lit de poudre par faisceau d'électrons (E-PBF), dépôt d'énergie dirigée à base de poudre (P-DED) et dépôt d'énergie dirigée à base de fil (W-DED). D'autres types de FA sont enregistrés par leurs noms tels que le jet de liant et l'extrusion de métal. Le type de matière première par défaut est « poudre » pour L-PBF, E-PBF et P-DED, et « fil » pour W-DED.

Dans notre base de données, les entrées de données non signalées explicitement sont enregistrées sous forme de tableaux vides (MAT), de listes (JSON), de chaînes (MAT et JSON) ou de cellules (EXCEL). « Tel que construit » est attribué au traitement de surface, « NHT » est attribué au traitement thermique et « 25 °C » est attribué à la température de préchauffage s'ils ne sont pas appliqués (NA). Nous supposons également que les essais sont uniaxiaux et réalisés dans un environnement ambiant (25 °C, air) avec un facteur de concentration de contraintes, Kt = 1 si non spécifié. Le contrôle de charge par défaut est « force » pour SN, « déformation » pour ε-N, « charge » pour da/dN-ΔK et « déplacement » pour la fatigue hypercyclique (VHCF), indépendamment des types de données. Il est suggéré que les procédures ou réglages facultatifs soient indiqués comme NA dans les rapports sur les données de fatigue s'ils ne sont pas spécifiquement indiqués.

En résumé, la base de données FatigueData-AM202248 couvre 116 types d'alliages AM au total. 459 articles rapportent 1 610 ensembles de données SN avec 15 146 points de données, 79 articles rapportent 236 ensembles de données ε-N avec 1 840 points de données et 135 articles rapportent 614 ensembles de données da / dN-ΔK (Fig. 4). 65 % des données sont des données SN utilisées pour mesurer la durée de vie en fatigue dans le régime HCF et pour la conception de durée de vie sûre55,56,57. Les composants critiques de l'industrie aérospatiale et de l'énergie dans des conditions difficiles nécessitent également des données ε-N et da/dN-ΔK.

Les mesures de performance du traitement des figures, des tableaux et du texte montrent que les scores F1 de l'extraction automatisée sont d'environ 60 à 90 % (tableau 2). Tous les enregistrements de données sont examinés et corrigés manuellement pour produire une base de données de haute qualité. Une inspection ultérieure de 50 articles choisis au hasard montre que la précision est améliorée pour être > 98 %.

L'un des problèmes pratiques liés à l'extraction de données à partir de figures est la distorsion des symboles et des repères d'axe après la pixellisation, ce qui rend difficile la détermination des positions des centroïdes avec une grande précision. La comparaison des données SN et ε-N extraites des figures et celles des tableaux, si les deux ont été publiés, montre une incohérence dans moins de 5% des 40 articles en raison des incertitudes dans la localisation des points de données. Les paramètres d'ajustement des données en utilisant Eq. 8 sont comparées aux valeurs rapportées dans les articles, montrant également une incohérence <5%.

Les données représentatives et leurs statistiques sont tracées à la Fig. 5 à titre d'illustration et la qualité des données est évaluée par la connaissance du domaine. Les données SN pour les 4 alliages AM les plus rapportés (Ti-6Al-4V, 316 L, AlSi10Mg et IN718) sont incluses dans la Fig. 5a et la durée de vie diminue à mesure que l'amplitude de contrainte augmente. La résistance à la fatigue des alliages Ti-6Al-4V et IN718 est supérieure, suivie par 316 L et AlSi10Mg (Fig. 5a). Les statistiques des matériaux, des types de MA et du traitement de surface des ensembles de données SN sont résumées à la Fig. 5b. Ti-6Al-4V occupe 90 % des données pour les alliages de titane AM et IN718 occupe 77 % pour les alliages de nickel AM. Le pourcentage élevé d'occupations découle de leur prédominance dans les alliages de titane et de nickel conventionnels pour les procédures de fabrication à haute résistance et matures58,59. Bien que AlSi10Mg ne soit pas très populaire parmi les alliages d'aluminium conventionnels, il représente 66 % des alliages d'aluminium AM en raison de sa bonne imprimabilité60. Le 316 L ne représente que 43 % des aciers AM et d'autres types prennent également une part, signalant la diversité des applications des aciers61. Il est à noter que la plupart des éprouvettes de fatigue sont préparées par PBF, en particulier L-PBF (83%), qui est la technique AM la plus mature et la plus commercialisée (Fig. 5b)61. Le processus d'impression couche par couche et la nature non équilibrée de la FA peuvent entraîner une mauvaise qualité de surface, à laquelle les données SN sont sensibles. Différents types de traitement de surface sont étudiés (Fig. 5b).

Données représentatives. ( a ) Ensembles de données SN représentatifs de 4 principaux alliages AM, Ti-6Al-4V, IN718, 316 L et AlSi10Mg. ( b ) Statistiques des alliages AM étudiés pour les données SN. L'axe des abscisses est marqué par l'élément majeur des alliages ou leurs types. 'MPEA' désigne les alliages à plusieurs éléments principaux. « Hybride » désigne des matériaux hybrides ou gradués. L'encart montre des diagrammes circulaires des types de AM et des conditions de surface, où « PBF » désigne la fusion sur lit de poudre, « L-PBF » désigne le laser PBF, « E-PBF » désigne le faisceau d'électrons PBF et « DED » désigne le dépôt d'énergie dirigée. Données représentatives (c) ε-N et (d) da/dN-ΔK des principaux alliages AM.

Les données représentatives ε-N et da / dN-ΔK sont présentées sur les figures 5c, d. La durée de vie à la fatigue diminue à mesure que l'amplitude de la déformation augmente (Fig. 5c) et le taux de FCG augmente avec la plage SIF (Fig. 5d). La qualité des données est en outre évaluée par la relation entre les données de fatigue et les autres propriétés des alliages, qui est démontrée ici en utilisant les données SN comme exemple. La relation entre la résistance à la fatigue (σf) et l'UTS (σu) et les effets des conditions de chargement et de traitement sont bien connus pour les alliages conventionnels2,62,63. La figure 6a confirme la corrélation positive entre σf et σu, c'est-à-dire qu'un σu élevé indique une résistance élevée à la fatigue en supprimant l'accumulation de dommages. Le rapport entre σf et σu (0,2–0,7) pour les alliages AM est proche de celui des alliages conventionnels (0,25–0,65)2.

La validation des données. (a) Relation entre la résistance à la fatigue mesurée après 106 cycles, σf, et la résistance ultime à la traction (UTS), σu. Les références σf = 0.2σu et σf = 0.7σu sont ajoutées sous forme de lignes pointillées. ( b ) L'effet du rapport de contrainte, R , sur les relations SN de AM Ti-6Al-4V.

Les tests SN sont généralement effectués à des rapports de contrainte spécifiques, Rσ, qui pourraient introduire l'effet de la contrainte moyenne, σm = (σmax + σmin)/2. La relation entre Rσ et σm peut être dérivée de l'Eq. 5, qui est \({R}_{\sigma }=1-\frac{2{\sigma }_{{\rm{a}}}}{{\sigma }_{{\rm{m}}}+{\sigma }_{{\rm{a}}}}\). La figure 6b montre les performances de l'AM Ti-6Al-4V testé sous Rσ = −1 (σm = 0) et 0,1 (σm = 0,55σmax). La contrainte de traction moyenne dégrade la résistance à la fatigue même en cas de forte dispersion des données, ce qui est également en accord avec la connaissance du domaine des alliages conventionnels.

Il existe des limites dans les applications des bases de données sur la fatigue construites à partir de sources ouvertes par rapport aux ensembles de données publiés par des institutions faisant autorité. En plus de la diversité dans la fabrication des matériaux, la préparation des échantillons et la finition de surface des spécimens, l'incompatibilité des normes de test et l'incomplétude des enregistrements entraînent également des difficultés à améliorer la qualité des données, ainsi que l'intégration avec des bases de données faisant autorité ou de nouvelles données rapportées dans la littérature. Un système d'évaluation est introduit pour les données à utiliser dans la conception de l'intégrité structurelle. Les entrées de données peuvent être affectées de pondérations en fonction de la connaissance du domaine ou de leur covariance avec les données de fatigue. Des mesures supplémentaires telles que le nombre de données sur la fatigue47, le nombre de citations de la publication et la précision de l'extraction des données pourraient également être introduites. Pour chaque ensemble de données sur la fatigue, un score compris entre 0 et 1 est calculé comme la somme pondérée des entrées non vides. L'algorithme de notation est subjectif et nous laissons ce travail aux utilisateurs des données. Ici, par souci de simplicité, nous supposons des poids égaux pour toutes les entrées (Fig. 7a). Le traitement de surface et le traitement thermique (y compris HIP et NHT) sont considérés comme deux entrées distinctes de paramètres de traitement. Nous constatons que la plupart des ensembles de données sont évalués avec des scores allant de 0,5 à 0,9 puisque toutes les entrées de données ne sont pas documentées. 87 % des ensembles de données ont des scores supérieurs à 0,6, qui contiennent des informations essentielles telles que les types de matériaux, les types de FA et les tests de fatigue. Les taux de remplissage (FR) des entrées de données comptées sur tous les ensembles de données mesurent la qualité de la base de données (Fig. 7b), qui ne devrait pas être élevée compte tenu de la diversité des sources de données. Les types de matériaux (par exemple Ti-6Al-4V, IN718), AM (par exemple PBF, DED), les essais de fatigue (par exemple uniaxial, flexion) et les rapports de charge sont des informations essentielles et sont fournies dans la plupart des articles sur la fatigue AM. Pour les entrées de données liées à la FA et au traitement, les FR de la machine FA, l'épaisseur de la couche, la direction des éprouvettes, le traitement thermique et le traitement de surface sont supérieurs à 70 % alors que les autres entrées sont moins remplies. Pour les essais de fatigue, 80 % des articles rapportaient la fréquence de chargement puisqu'elle pouvait varier de 4 ordres de grandeur en pratique. Les effets de la fréquence pourraient être importants car l'effet de chauffage est introduit, par exemple, par la dissipation plastique dans le LCF ou la vibration dans le VHCF. De plus, le taux de déformation est proportionnel à la fréquence à laquelle les processus d'endommagement pourraient être sensibles, et dans un environnement corrosif, la dégradation du matériau dépend également du taux64,65. Étonnamment, seulement 40 % des articles ont fait état de la norme d'essai de fatigue qu'ils ont suivie. Compte tenu de la variation des microstructures et des conditions de surface (tel que construit), la mise en œuvre des normes d'essai de fatigue traditionnelles pour la recherche sur la fatigue AM devrait être évaluée66. De nouvelles conceptions de spécimens, par exemple dans des types miniatures67, et des techniques de test telles que VHCF méritent également d'être discutées plus avant. Les RF des propriétés mécaniques statiques ne dépassent pas 50 % car la dispersion des données n'est pas élevée.

Qualité des données mesurée par les scores de notation et les taux de remplissage. (a) L'histogramme des scores d'évaluation pour les ensembles de données de fatigue, où toutes les entrées de données sont pondérées de manière égale. (b) Les taux de remplissage (FR) des types de matériaux, les paramètres de la FA, le traitement, les essais et les propriétés mécaniques statiques. (c) Le langage unifié des données de fatigue (ULFD).

Nos résultats mettent en évidence la nécessité de normes d'essais de fatigue AM ainsi que de normes de communication des données dans les revues, les actes de conférence et les rapports techniques, qui sont cruciaux pour le développement de bases de données de haute qualité et la recherche centrée sur les données. Un langage unifié des données de fatigue (ULFD) est suggéré ici selon les normes connexes pour la FA, le traitement et les essais68. La base de données actuelle peut être exportée à l'aide de l'ULFD (Fig. 7c), qui décrit non seulement le flux de travail de la construction de la base de données, mais guide également l'analyse des données et la planification expérimentale.

La dispersion des données et l'écart du système doivent être notés lors de l'analyse des données sur la fatigue rapportées dans la littérature. Par exemple, la résistance à la fatigue de l'AM Ti-6Al-4V est non seulement inférieure à son homologue conventionnel, comme indiqué dans la base de données NIMS, mais montre également une plus grande dispersion (Fig. 8a). La comparaison avec les données MMPDS conduit à la même conclusion. Pour quantifier le degré de dispersion, la fonction de densité de probabilité log-normale \({p}_{{\rm{f}}}\left(x\right)=\frac{1}{s\sqrt{2\pi }}\exp \left[-\frac{1}{2}{\left(\frac{ln(x)-\mu }{s}\right)}^{2}\right]\) est supposée et ajustée à l'aide de l'équation. 9 pour calculer la moyenne, μ, et la variance, s de la résistance à la fatigue après 106 cycles (Fig. 8b). Les valeurs de s pour les ensembles de données vont de 1,6 × 10−4 à 45,1 × 10−4, dont la plupart sont supérieures aux valeurs de la classe NIMS 1100 (3,1 × 10−4) et de la classe 900 pour Ti-6Al-4V (1,7 × 10−4). Les données AM sont plus dispersées que les données NIMS quels que soient les types de matériaux, ce qui peut être attribué à la diversité des microstructures des matériaux, y compris les défauts. L'optimisation des paramètres AM ou des procédures de post-traitement pourrait réduire la dispersion des performances de fatigue et mieux servir les applications critiques. Bien qu'elles affichent une nature plus dispersée par rapport aux bases de données faisant autorité, les données AM collectées dans la littérature fournissent toujours des informations clés sur les propriétés des matériaux et les lignes directrices pour la conception en fatigue (Fig. 5).

Dispersion des données et déviation du système. ( a ) La comparaison entre les données SN des alliages AM extraites de la littérature et les données NIMS publiées pour Ti-6Al-4V sous le rapport de contrainte R = -1. 'Classe 1100' indique que l'UTS est au niveau de 1100 MPa et 'Classe 900' indique 900 MPa. (b) La fonction de densité de probabilité, pf, de la résistance à la fatigue, σf, après 106 cycles pour les ensembles de données en (a), normalisée par les maxima. Les données NIMS sont affichées dans le panneau supérieur et les données AM dans le panneau inférieur. Pour les données AM, les lignes indiquent les données ajustées à partir d'ensembles de données indépendants, et la zone ombrée recueille toutes les données. ( c ) La comparaison entre les données SN pour les alliages Ti-6Al-4V traités thermiquement (HT) et pressés isostatiquement à chaud (HIP). Les jeux de données sont mis à l'échelle en (d) en fonction des données de référence (Eq. 11).

En plus de la dispersion des données, la Fig. 8b montre qu'il existe une déviation du système parmi les données de fatigue provenant de différentes études. Par exemple, le pressage isostatique à chaud (HIP) est une procédure efficace à haute pression et haute température pour réduire les défauts internes (poreux) dans les alliages, ce qui améliore leurs performances HCF en supprimant l'initiation des fissures. L'effet du HIP sur les performances en fatigue est comparé à celui d'un traitement thermique ordinaire qui fonctionne à des températures plus basses sans pressurisation (Fig. 8c). Les deux ensembles de données peuvent difficilement être distingués en raison non seulement de la dispersion des données, mais également de la déviation du système résultant des différences dans les procédures de préparation et de test des échantillons. Pour résoudre ce problème, l'une des données de fatigue HIP publiées est sélectionnée comme référence. Toutes les données de fatigue HIP sont ensuite ajustées par l'équation de Basquin (équation 9) et mises à l'échelle par rapport à la référence. Le facteur d'échelle pour σa à des cycles spécifiques N est calculé comme suit

où l'exposant 'ref' désigne les données de référence. Les données de traitement thermique (HT) sont ensuite mises à l'échelle en utilisant la valeur de α pour les données HIP rapportées dans les mêmes articles, c'est-à-dire \({\sigma }_{{\rm{a}}}^{{\rm{HT}},{\rm{scaled}}}=\alpha {\sigma }_{{\rm{a}}}^{{\rm{HT}}}\). Les résultats montrent clairement que HIP surpasse HT dans l'amélioration des performances HCF, où la durée de vie en fatigue est contrôlée par l'initiation de fissures (Fig. 8d). Cependant, HT semble être supérieur pour LCF (N < 104), où la déformation plastique est cruciale. Cela peut s'expliquer par le processus de grossissement des grains dans HIP, qui affaiblit la résistance des alliages à la déformation plastique69.

Notre base de données jette les bases d'un criblage de matériaux basé sur les données et d'une estimation de la durée de vie des composants AM, offrant des solutions rentables pour la conception technique. L'analyse critique des entrées de la base de données offre des informations clés sur la feuille de route technique70, qui pourrait optimiser la stratégie d'investissement dans la recherche et le développement. Notre base de données peut également servir d'ensemble de données d'entraînement pour les modèles NLP, ML et CV afin d'améliorer les performances des prédictions des modèles. De plus, l'approche actuelle peut être étendue à d'autres informations sur les alliages AM et aux données de fatigue d'autres alliages. Cependant, l'extraction de données de la littérature antérieure pour les alliages conventionnels pourrait présenter des difficultés dans le traitement des fichiers PDF basés sur des images, où le texte et les figures/tableaux sont de mauvaise qualité et difficiles à extraire. Les travaux futurs se concentreront sur l'amélioration du niveau d'automatisation du flux de travail actuel et sur la résolution des problèmes d'analyse des premiers documents.

Les scripts utilisés pour extraire les informations des figures, des tableaux et du texte sont principalement basés sur des codes open source tels que ChemDataExtractor 2.043, table extractor39 et Simple Transformer (https://simpletransformers.ai/), respectivement. Les scripts internes pour l'extraction et l'analyse des données sont rendus publics dans le référentiel GitHub (https://github.com/xuzpgroup/ZianZhang/tree/main/FatigueData-AM2022), qui peut être utilisé en reconnaissant l'article actuel et sous la licence MIT71. Ces scripts incluent un didacticiel détaillé, étape par étape, pour le chargement et l'analyse de l'ensemble de données dans le référentiel.

Suresh, S. Fatigue des matériaux (Cambridge University Press, 1998).

Stephens, RI, Fatemi, A., Stephens, RR & Fuchs, HO Metal Fatigue in Engineering (John Wiley & Sons, 2000).

Agrawal, A. et al. Exploration des techniques de science des données pour prédire la résistance à la fatigue de l'acier à partir des paramètres de composition et de traitement. Intégr. Mater. Fab. Innov. 3, 90-108 (2014).

Article Google Scholar

Yaghoobi, M. et al. Cadre de calcul PRISMS-fatigue pour l'analyse de la fatigue dans les métaux et alliages polycristallins. npj Comput. Mater. 7, 38 (2021).

Article ADS CAS Google Scholar

Institut Battelle Memorial. Développement et normalisation des propriétés des matériaux métalliques (MMPDS-17) (Battelle Memorial Institute, 2022).

Furuya , Y. , Nishikawa , H. , Hirukawa , H. , Nagashima , N. & Takeuchi , E. Catalog of NIMS fatigue data sheets . Sci. Technol. Adv. Mater. 20, 1055-1072 (2019).

Article PubMed PubMed Central Google Scholar

Kononova, O. et al. Opportunités et défis du text mining dans la recherche sur les matériaux. iScience 24, 102155 (2021).

Article ADS PubMed PubMed Central Google Scholar

Herzog, D., Seyda, V., Wycisk, E. & Emmelmann, C. Fabrication additive de métaux. Acta Mater. 117, 371–392 (2016).

Article ADS CAS Google Scholar

Nadammal, N. et al. Rôle critique des stratégies de balayage sur le développement de la microstructure, de la texture et des contraintes résiduelles lors de la fabrication additive par fusion laser sur lit de poudre. Ajouter. Fab. 38, 101792 (2021).

CAS Google Scholar

Li, Y., Liang, X., Yu, Y., Wang, D. et Lin, F. Examen de la fabrication additive de superalliages monocristallins à base de nickel. Menton. J. Mech. Ing. : Addit. Fab. Devant. 1, 100019 (2022).

Google Scholar

Sanaei, N. & Fatemi, A. Défauts dans les métaux manufacturés additifs et leur effet sur les performances de fatigue : une revue de l'état de l'art. Programme. Mater. Sci. 117, 100724 (2021).

Article CAS Google Scholar

Shao, S., Khonsari, MM, Guo, S., Meng, WJ & Li, N. Présentation : La fabrication additive a permis d'accélérer la conception d'alliages à base de Ni pour une meilleure résistance à la fatigue. Ajouter. Fab. 29, 100779 (2019).

CAS Google Scholar

Zhao, L. et al. Revue sur la corrélation entre la microstructure et les performances mécaniques pour la fusion laser sur lit de poudre AlSi10Mg. Ajouter. Fab. 56, 102914 (2022).

CAS Google Scholar

Molaei, R. et al. Fatigue du Ti-6Al-4V fabriqué par additif, partie II : la relation entre la microstructure, les propriétés cycliques des matériaux et les performances des composants. Int. J. Fatigue 132, 105363 (2020).

Article CAS Google Scholar

Cao, M., Liu, Y. & Dunne, FP Une approche de la plasticité cristalline pour comprendre la réponse à la fatigue par rapport aux pores dans les alliages d'aluminium fabriqués par fabrication additive. Int. J. Fatigue 161, 106917 (2022).

Article CAS Google Scholar

Zhan, Z. & Li, H. Prédiction de la durée de vie en fatigue basée sur l'apprentissage automatique avec effets des paramètres du processus de fabrication additive pour le SS 316L imprimé. Int. J. Fatigue 142, 105941 (2021).

Article CAS Google Scholar

Maleki, E. et al. Sur l'efficacité de l'apprentissage automatique pour l'évaluation de la fatigue de l'AlSi10Mg fabriqué de manière additive et post-traité. Int. J. Fatigue 160, 106841 (2022).

Article CAS Google Scholar

Li, P., Warner, D., Fatemi, A. & Phan, N. Évaluation critique des performances en fatigue du Ti-6Al-4V fabriqué de manière additive et perspective de recherches futures. Int. J. Fatigue 85, 130–143 (2016).

Article CAS Google Scholar

Chern, AH et al. Revue du comportement en fatigue du Ti-6Al-4V fabriqué par fabrication additive par fusion par faisceau d'électrons. Int. J. Fatigue 119, 173–184 (2019).

Article CAS Google Scholar

Afkhami, S., Dabiri, M., Piili, H. & Björk, T. Effets des paramètres de fabrication et du post-traitement mécanique sur l'acier inoxydable 316L traité par fusion laser sur lit de poudre. Mater. Sci. Eng., A 802, 140660 (2021).

Article CAS Google Scholar

Lesperance, X., Ilie, P. & Ince, A. Caractérisation de la fatigue à très haut cycle des alliages d'aluminium AlSi10Mg et AlSi7Mg fabriqués de manière additive sur la base d'essais de fatigue par ultrasons. Fraction de fatigue. Ing. Mater. Structure. 44, 876–884 (2021).

Article CAS Google Scholar

UNESCO. Recommandation de l'UNESCO sur la science ouverte https://doi.org/10.54677/MNMH8546 (2021).

Woelfle, M., Olliaro, P. & Todd, MH La science ouverte est un accélérateur de recherche. Nat. Chim. 3, 745–748 (2011).

Article CAS PubMed Google Scholar

Kononova, O. et al. Ensemble de données text-mined de recettes de synthèse de matériaux inorganiques. Sci. Données 6, 203 (2019).

Article PubMed PubMed Central Google Scholar

Court, CJ & Cole, JM Base de données de matériaux générée automatiquement des températures de Curie et de Néel via l'extraction de relations semi-supervisée. Sci. Données 5, 180111 (2018).

Article CAS PubMed PubMed Central Google Scholar

Kumar, P., Kabra, S. & Cole, JM Génération automatique de bases de données sur la limite d'élasticité et la taille des grains à l'aide de ChemDataExtractor. Sci. Données 9, 292 (2022).

Article CAS PubMed Central Google Scholar

Chen, S. et al. Jeu de données de fatigue des alliages à haute entropie. Sci. Données 9, 381 (2022).

Article CAS PubMed PubMed Central Google Scholar

Fortunato, S. et al. Sciences des sciences. Sciences 359, eaao0185 (2018).

Article PubMed PubMed Central Google Scholar

ISO/ASTM 52900:2015. Fabrication additive – Principes généraux – Terminologie (ISO/ASTM International, 2015).

ASTM F3413–19. Guide for Additive Manufacturing–Design–Directed Energy Deposition (ASTM International, 2019).

Thompson, SM, Bian, L., Shamsaei, N. & Yadollahi, A. Un aperçu du dépôt laser direct pour la fabrication additive ; Partie I : Phénomènes de transport, modélisation et diagnostic. Ajouter. Fab. 8, 36–62 (2015).

Google Scholar

Gu, DD, Meiners, W., Wissenbach, K. & Poprawe, R. Fabrication additive laser de composants métalliques : matériaux, procédés et mécanismes. Int. Mater. Rév. 57, 133–164 (2012).

Article CAS Google Scholar

Frazier, WE Fabrication additive métallique : Une revue. J. Mater. Ing. Effectuer. 23, 1917-1928 (2014).

Article CAS Google Scholar

Murr, LE et al. Fabrication de métaux par fabrication additive utilisant les technologies de fusion par laser et faisceau d'électrons. J. Mater. Sci. Technol. 28, 1–14 (2012).

Article CAS Google Scholar

Suwanpreecha, C. & Manonukul, A. Un examen de la fabrication additive par extrusion de matériaux en métal et de sa comparaison avec le moulage par injection de métal. Métaux 12, 429 (2022).

Article CAS Google Scholar

Liu, Y. et al. RoBERTa : Une approche de préformation BERT robustement optimisée. Préimpression sur https://arxiv.org/abs/1907.11692 (2019).

Kim, E. et al. Paramètres de synthèse appris et codifiés des matériaux oxydes. Sci. Données 4, 170127 (2017).

Article CAS PubMed PubMed Central Google Scholar

Berchmans, D. & Kumar, S. Reconnaissance optique de caractères : un aperçu et un aperçu. 2014 Int. Conf. sur le Contrôle, l'Instrumentation, la Commun. Calcul. Technol., 1361–1365 (2014).

Jensen, Z. et al. Une approche d'apprentissage automatique de la synthèse de zéolithe rendue possible par l'extraction automatique des données de la littérature. ACS Cent. Sci. 5, 892–899 (2019).

Article CAS PubMed PubMed Central Google Scholar

Zhu, M. & Cole, JM PDFDataExtractor : un outil pour lire des textes scientifiques et interpréter les métadonnées de la littérature composée au format de document portable. J. Chem. Inf. Modèle. 62, 1633-1643 (2022).

Article CAS PubMed PubMed Central Google Scholar

Devlin, J., Chang, MW, Lee, K. & Toutanova, K. BERT : Pré-formation de transformateurs bidirectionnels profonds pour la compréhension du langage. Préimpression sur https://arxiv.org/abs/1810.04805 (2018).

Loshchilov, I. & Hutter, F. Régularisation de la décroissance du poids découplée. Préimpression sur https://arxiv.org/abs/1711.05101 (2017).

Mavracic, J., Court, CJ, Isazawa, T., Elliott, SR & Cole, JM ChemDataExtractor 2.0 : ontologies auto-remplies pour la science des matériaux. J. Chem. Inf. Modèle. 61, 4280–4289 (2021).

Article CAS PubMed Google Scholar

Brown, T. et al. Les modèles de langage sont des apprenants peu nombreux. Adv. Information neuronale. Processus. Syst. 33, 1877-1901 (2020).

Google Scholar

Dunn, A. et al. Extraction d'informations structurées à partir de textes scientifiques complexes avec de grands modèles de langage affinés. Préimpression sur https://arxiv.org/abs/2212.05238 (2022).

OpenAI. Rapport technique GPT-4. Préimpression sur https://arxiv.org/abs/2303.08774 (2023).

ASTM E739–10. Pratique standard pour l'analyse statistique des données de fatigue linéaires ou linéarisées contrainte-vie (S–N) et déformation–vie (ε–N) (ASTM International, 2015).

Zhang, Z. & Xu, Z. Base de données de fatigue des alliages fabriqués de manière additive. part de figue. https://doi.org/10.6084/m9.figshare.22337629 (2023).

Li, P., Warner, D. & Phan, N. Prédiction des performances de fatigue d'un composant Ti-6Al-4V fabriqué de manière additive à partir du comportement du coupon témoin. Ajouter. Fab. 35, 101230 (2020).

CAS Google Scholar

Gu, D. et al. Fabrication additive laser-métal intégrée matériau-structure-performance. Sciences 372, eabg1487 (2021).

Article CAS PubMed Google Scholar

Xu, Z., Liu, A. & Wang, X. Performances en fatigue et comportement de propagation des fissures de l'AlSi10Mg fondu au laser sélectif dans les directions de construction 0°, 15°, 45° et 90°. Mater. Sci. Eng., A 812, 141141 (2021).

Article CAS Google Scholar

Murchio, S. et al. Entretoises minces en Ti-6Al-4V fabriquées de manière additive par fusion laser sur lit de poudre : effet de l'orientation du bâtiment sur la précision géométrique et les propriétés mécaniques. J. Mech. Comportement Biomédical. Mater. 119, 104495 (2021).

Article CAS PubMed Google Scholar

Li, P. et al. Vers la prédiction des différences de performance en fatigue des coupons Ti-6Al-4V fusionnés sur lit de poudre laser de la même fabrication. Int. J. Fatigue 126, 284–296 (2019).

Article CAS Google Scholar

Levkulich, N. et al. L'effet des paramètres de processus sur l'évolution des contraintes résiduelles et la distorsion dans la fusion laser sur lit de poudre de Ti-6Al-4V. Ajouter. Fab. 28, 475–484 (2019).

CAS Google Scholar

Conseil de recherche en génie mécanique (FKM). Directive FKM : Évaluation de la résistance analytique des composants en génie mécanique (VDMA Verlag, 2003).

EN 1993–1–9. Eurocode 3 : Calcul des structures en acier – Partie 1–9 : Fatigue (Comité européen de normalisation, 2005).

ANSI/ASME B106.1 M–1985. Conception des arbres de transmission (The American Society of Mechanical Engineers, 1985).

Leyens, C. & Peters, M. Titane et alliages de titane : fondamentaux et applications (John Wiley & Sons, 2003).

Paulonis, DF & Schirra, JJ Alliage 718 chez Pratt & Whitney : perspective historique et défis futurs. Superalliages 718, 625, 706 et divers dérivés, 13–23 (2001).

Aboulkhair, NT et al. Impression 3D d'alliages d'aluminium : Fabrication additive d'alliages d'aluminium par fusion laser sélective. Programme. Mater. Sci. 106, 100578 (2019).

Article CAS Google Scholar

Narasimharaju, SR et al. Une revue complète sur la fusion laser des aciers sur lit de poudre : Traitement, microstructure, défauts et méthodes de contrôle, propriétés mécaniques, défis actuels et tendances futures. J. Manuf. Processus. 75, 375–414 (2022).

Article Google Scholar

Liu, R., Zhang, P., Zhang, Z., Wang, B. et Zhang, Z. Un modèle pratique pour une conception anti-fatigue efficace et la sélection de matériaux métalliques : I. Construction de modèles et prédiction de la résistance à la fatigue. J. Mater. Sci. Technol. 70, 233–249 (2021).

Article Google Scholar

Liu, R., Zhang, P., Zhang, Z., Wang, B. et Zhang, Z. Un modèle pratique pour une conception anti-fatigue efficace et la sélection de matériaux métalliques : II. Analyse des paramètres et amélioration de la résistance à la fatigue. J. Mater. Sci. Technol. 70, 250-267 (2021).

Article Google Scholar

Tahmasbi, K., Alharthi, F., Webster, G. & Haghshenas, M. Dommages de fatigue dépendant de la fréquence dynamique dans les métaux : une revue de l'état de l'art. Mécanique des forces. 10, 100167 (2023).

Article Google Scholar

Milne, L., Gorash, Y., Comlekci, T. et MacKenzie, D. Effets de fréquence dans les essais de fatigue par ultrasons (UFT) de l'acier de construction Q355B. Structure de procédure. Intégrité 42, 623–630 (2022).

Article Google Scholar

Hrabe, NW et al. Résultats de l'atelier NIST/ASTM sur le comportement mécanique des composants de fabrication additive. Série de fabrication avancée (NIST AMS), 1–13 (2016).

Nicoletto, G. Comportement de fatigue en douceur et en entaille de l'Inconel 718 fondu sélectivement au laser avec des surfaces telles que construites. Int. J. Fatigue 128, 105211 (2019).

Article CAS Google Scholar

Wang, Z. et al. ULSA : Langage unifié d'actions de synthèse pour la représentation de protocoles de synthèse inorganique. Découverte numérique. 163, 313–324 (2022).

Article Google Scholar

Schijve, J. Fatigue des structures et des matériaux (Springer, 2009).

De Weck, Feuille de route et développement de la technologie OL : une approche quantitative de la gestion de la technologie (Springer Nature, 2022).

Saltzer, JH L'origine de la "licence MIT". IEEE Ann. Hist. Calcul. 42, 94–98 (2020).

Article Google Scholar

Télécharger les références

Cette étude a été soutenue par la Fondation nationale des sciences naturelles de Chine grâce aux subventions 11825203, 11832010, 11921002, 52090032, 12122204 et 11872150.

Université Tsinghua, Laboratoire de mécanique appliquée et Département d'ingénierie mécanique, Pékin, 100084, Chine

Zian Zhang et Zhiping Xu

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

ZX a conçu et supervisé la recherche. ZZ a effectué le travail. Les deux auteurs ont participé à la discussion des résultats et à la préparation du manuscrit.

Correspondance avec Zhiping Xu.

Les auteurs ne déclarent aucun intérêt concurrent.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Zhang, Z., Xu, Z. Base de données sur la fatigue des alliages fabriqués de manière additive. Sci Data 10, 249 (2023). https://doi.org/10.1038/s41597-023-02150-x

Télécharger la citation

Reçu : 04 janvier 2023

Accepté : 12 avril 2023

Publié: 02 mai 2023

DOI : https://doi.org/10.1038/s41597-023-02150-x

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt