Dans cet article
- L’expression « intelligence artificielle » a été utilisée pour la première fois en 1956 lors de la conférence de Dartmouth
- C’est John McCarthy, mathématicien américain, qui a proposé ce terme dans la proposition officielle de l’atelier
- Les travaux précurseurs d’Alan Turing dès 1950 ont posé les bases théoriques de la discipline
- L’IA a traversé plusieurs « hivers » avant de connaître un essor spectaculaire avec le deep learning à partir de 2012
- L’IA générative grand public est apparue fin 2022 avec ChatGPT, mais ses fondations remontent aux années 2010
- On distingue aujourd’hui 4 grands types d’IA : réactive, à mémoire limitée, théorie de l’esprit et conscience de soi
Sommaire
- Origine de l’expression intelligence artificielle : la conférence de Dartmouth en 1956
- Qui a proposé le terme « intelligence artificielle » en 1956 ?
- Les précurseurs de l’IA avant 1956 : de Turing à la cybernétique
- Les grandes étapes de l’histoire de l’intelligence artificielle
- Les 4 types d’intelligence artificielle : classification actuelle
- Date de création de l’IA générative : du deep learning à ChatGPT
- Quelle est la première intelligence artificielle de l’histoire ?
- L’impact de l’expression « intelligence artificielle » sur le monde d’aujourd’hui
Quand on parle d’intelligence artificielle, on pense souvent aux assistants vocaux, aux voitures autonomes ou aux modèles de langage comme ChatGPT. Pourtant, cette expression a une histoire bien plus ancienne qu’on ne l’imagine. En tant que formatrice en BTS SIO, je constate régulièrement que mes étudiants sont surpris d’apprendre que le concept remonte à plus de soixante-dix ans. Alors, de quand date l’expression intelligence artificielle exactement ? Je vous propose un voyage dans le temps pour comprendre comment ce terme est né, qui l’a inventé, et pourquoi il continue de façonner notre quotidien de développeurs et de professionnels du numérique.
Origine de l’expression intelligence artificielle : la conférence de Dartmouth en 1956
L’expression « intelligence artificielle » (en anglais artificial intelligence) apparaît officiellement pour la première fois dans un document daté de l’été 1956. Ce document est la proposition de recherche rédigée pour organiser un atelier d’été au Dartmouth College, dans le New Hampshire aux États-Unis. Ce workshop, qui s’est tenu du 18 juin au 17 août 1956, est aujourd’hui considéré comme l’acte fondateur de l’intelligence artificielle en tant que discipline scientifique à part entière.
La proposition originale, rédigée fin 1955, posait une hypothèse audacieuse : « chaque aspect de l’apprentissage ou toute autre caractéristique de l’intelligence peut, en principe, être décrit de manière suffisamment précise pour qu’une machine puisse le simuler ». Cette phrase, d’une simplicité apparente, contenait en germe tout un programme de recherche qui allait occuper des milliers de chercheurs pendant les décennies suivantes.
L’atelier de Dartmouth a réuni une dizaine de chercheurs pendant plusieurs semaines. Parmi eux, on retrouve des noms qui deviendront des légendes de l’informatique : John McCarthy, Marvin Minsky, Nathaniel Rochester et Claude Shannon. Si les résultats concrets de cet été de travail furent modestes, l’impact symbolique fut immense. Pour la première fois, un groupe de scientifiques affirmait publiquement que les machines pouvaient « penser », et ils donnaient un nom à cette ambition.
Selon la page Wikipedia consacrée à l’intelligence artificielle, cette conférence reste le point de départ consensuel de la discipline, même si des travaux antérieurs avaient déjà exploré des idées similaires sous d’autres appellations.
Qui a proposé le terme « intelligence artificielle » en 1956 ?
C’est John McCarthy (1927-2011) qui est crédité de l’invention du terme « artificial intelligence ». Mathématicien et informaticien américain, McCarthy était alors professeur assistant au Dartmouth College. Il a choisi cette expression pour nommer l’atelier d’été qu’il souhaitait organiser, et le terme est resté.
McCarthy a raconté plus tard qu’il avait délibérément choisi un nom accrocheur et ambitieux. Il voulait se démarquer du terme « cybernétique », déjà utilisé par Norbert Wiener, et du concept de « machines pensantes » (thinking machines) popularisé par Alan Turing. En forgeant « intelligence artificielle », il créait un champ de recherche autonome, avec sa propre identité et ses propres ambitions.

Au-delà de cette contribution terminologique, John McCarthy a apporté d’autres contributions majeures à l’informatique. Il est notamment le créateur du langage LISP en 1958, l’un des plus anciens langages de programmation encore utilisés aujourd’hui. Il a également contribué au développement du concept de temps partagé (time-sharing), qui préfigurait le cloud computing moderne. Ses travaux lui ont valu le prix Turing en 1971, souvent considéré comme l’équivalent du prix Nobel en informatique.
Il est important de noter que McCarthy n’était pas seul dans cette aventure. Les trois co-auteurs de la proposition de Dartmouth ont joué un rôle tout aussi décisif :
- Marvin Minsky : cofondateur du laboratoire d’IA du MIT, pionnier des réseaux neuronaux et de la vision artificielle
- Nathaniel Rochester : ingénieur chez IBM, concepteur du premier programme d’assemblage commercial
- Claude Shannon : père de la théorie de l’information, dont les travaux sont à la base de toute communication numérique
Ces quatre chercheurs sont collectivement considérés comme les pères fondateurs de l’intelligence artificielle. Si vous préparez un portfolio BTS SIO, connaître ces noms et cette date de 1956 fait partie de la culture informatique fondamentale.
Les précurseurs de l’IA avant 1956 : de Turing à la cybernétique
Si l’expression « intelligence artificielle » date de 1956, les idées qui la sous-tendent sont bien plus anciennes. Dès l’Antiquité, les mythes grecs évoquaient des automates créés par les dieux. Mais c’est au XXe siècle que les bases scientifiques ont été posées.
Alan Turing est sans doute le précurseur le plus important. En 1950, il publie son article fondateur « Computing Machinery and Intelligence » dans la revue Mind. Il y pose la question célèbre : « Les machines peuvent-elles penser ? » et propose le fameux test de Turing. Ce test consiste à déterminer si un humain, en conversation textuelle avec une machine, peut distinguer celle-ci d’un autre humain. Ce concept reste une référence en IA, même si ses limites sont aujourd’hui bien identifiées.
Avant Turing, d’autres jalons méritent d’être mentionnés :
- 1943 : Warren McCulloch et Walter Pitts publient un modèle mathématique du neurone artificiel, posant les bases des réseaux de neurones
- 1948 : Norbert Wiener publie Cybernetics, ouvrage fondateur qui explore les parallèles entre systèmes biologiques et mécaniques
- 1949 : Donald Hebb propose sa règle d’apprentissage (Hebbian learning), selon laquelle les connexions neuronales se renforcent par la répétition
- 1951 : Marvin Minsky construit le SNARC, premier réseau neuronal artificiel simulé sur machine, avec 40 neurones
- 1952 : Arthur Samuel développe un programme capable d’apprendre à jouer aux dames, l’un des premiers exemples de machine learning
Ces travaux montrent que l’IA n’est pas née d’un seul esprit brillant, mais d’une convergence de recherches en mathématiques, neurologie, ingénierie électronique et philosophie. La conférence de Dartmouth a simplement cristallisé ces efforts sous une bannière commune.
Les grandes étapes de l’histoire de l’intelligence artificielle
Depuis la conférence de Dartmouth, l’intelligence artificielle a connu un parcours mouvementé, ponctué d’espoirs démesurés et de déceptions profondes. Voici une chronologie des moments clés que je présente régulièrement à mes étudiants en langage et programmation.
| Période | Événement clé | Impact |
|---|---|---|
| 1956 | Conférence de Dartmouth | Naissance officielle de l’IA comme discipline |
| 1958 | Création du langage LISP par McCarthy | Premier langage dédié à la programmation IA |
| 1966 | Programme ELIZA de Joseph Weizenbaum | Premier chatbot simulant un psychothérapeute |
| 1969 | Publication de Perceptrons par Minsky et Papert | Frein majeur à la recherche sur les réseaux neuronaux |
| 1974-1980 | Premier « hiver de l’IA » | Réduction drastique des financements publics |
| 1980-1987 | Essor des systèmes experts | Adoption industrielle, puis désillusion |
| 1987-1993 | Second « hiver de l’IA » | Effondrement du marché des systèmes experts |
| 1997 | Deep Blue bat Kasparov aux échecs | L’IA entre dans l’imaginaire collectif |
| 2011 | Watson d’IBM gagne à Jeopardy! | Démonstration du traitement du langage naturel |
| 2012 | AlexNet révolutionne la vision par ordinateur | Renaissance du deep learning |
| 2016 | AlphaGo bat Lee Sedol au jeu de Go | Preuve de capacité dans des tâches complexes |
| 2017 | Publication de « Attention Is All You Need » | Naissance de l’architecture Transformer |
| 2022 | Lancement de ChatGPT par OpenAI | Démocratisation de l’IA générative |

Les deux « hivers de l’IA » sont des périodes particulièrement instructives. Le premier (1974-1980) a suivi des promesses excessives : des chercheurs avaient prédit que les machines traduiraient parfaitement les langues en quelques années. Quand ces objectifs se sont révélés irréalistes, les gouvernements ont coupé les financements. Le second hiver (1987-1993) a été provoqué par l’effondrement du marché des systèmes experts, ces programmes à base de règles qui devaient remplacer les experts humains dans des domaines spécialisés.
Ces cycles d’enthousiasme et de désillusion nous enseignent une leçon précieuse : il faut toujours évaluer les technologies avec un regard critique. C’est d’ailleurs un réflexe essentiel quand on envisage une reconversion en informatique ou que l’on choisit ses spécialisations de carrière.
Les 4 types d’intelligence artificielle : classification actuelle
Depuis que l’expression « intelligence artificielle » a été inventée en 1956, le champ de recherche s’est considérablement diversifié. On distingue aujourd’hui 4 grands types d’IA, classés selon leur degré de sophistication :
1. L’IA réactive (Reactive Machines)
C’est la forme la plus simple d’IA. Elle réagit à des stimuli sans conserver de mémoire des interactions passées. Deep Blue, le programme d’échecs d’IBM qui a battu Kasparov en 1997, en est l’exemple canonique. Ce type d’IA excelle dans des tâches spécifiques mais ne peut ni apprendre de l’expérience ni s’adapter à de nouvelles situations.
2. L’IA à mémoire limitée (Limited Memory)
Ce type d’IA peut utiliser des données récentes pour prendre des décisions. Les voitures autonomes en sont un bon exemple : elles analysent les données de capteurs des dernières secondes pour ajuster leur trajectoire. La plupart des applications d’IA actuelles, y compris les modèles de langage, appartiennent à cette catégorie. Elles apprennent à partir de données d’entraînement et conservent un contexte limité lors de l’interaction.
3. L’IA à théorie de l’esprit (Theory of Mind)
Ce type d’IA, encore largement théorique, serait capable de comprendre les émotions, les croyances et les intentions des humains. Certains chercheurs estiment que les grands modèles de langage actuels montrent des indices embryonnaires de cette capacité, mais le débat reste ouvert dans la communauté scientifique.
4. L’IA consciente (Self-Aware AI)
C’est le stade ultime, purement hypothétique à ce jour : une IA dotée d’une conscience de soi. Ce concept relève encore de la science-fiction et soulève des questions philosophiques profondes sur la nature même de la conscience. Aucun système actuel ne s’en approche.
Cette classification, souvent attribuée au chercheur Arend Hintze, aide à comprendre que l’IA n’est pas un monolithe. Quand vous travaillez sur un projet de DevOps ou de développement, vous interagissez avec des IA de type 1 ou 2. Garder cette distinction en tête permet de calibrer ses attentes et d’éviter les écueils du « tout-IA » mal compris.
Date de création de l’IA générative : du deep learning à ChatGPT
L’IA générative, qui fascine le grand public depuis 2022, a elle aussi une histoire plus longue qu’on ne le croit. Ses racines remontent aux travaux sur les réseaux de neurones profonds (deep learning) des années 2000 et 2010.
En 2014, Ian Goodfellow propose les GAN (Generative Adversarial Networks), une architecture où deux réseaux neuronaux s’affrontent pour générer des contenus de plus en plus réalistes. Cette innovation a permis de créer des images synthétiques bluffantes et a ouvert la voie à de nombreuses applications créatives.
Le véritable tournant arrive en 2017 avec la publication de l’article « Attention Is All You Need » par une équipe de Google Brain. Cet article introduit l’architecture Transformer, qui permet de traiter efficacement de longues séquences de texte en parallèle. C’est cette architecture qui est à la base de tous les grands modèles de langage actuels : GPT, Claude, Gemini, Llama.
La chronologie de l’IA générative peut se résumer ainsi :
- 2014 : invention des GAN par Ian Goodfellow
- 2017 : publication de l’architecture Transformer
- 2018 : lancement de GPT-1 par OpenAI (117 millions de paramètres)
- 2020 : GPT-3 impressionne avec 175 milliards de paramètres
- 2022 : Stable Diffusion (images) et ChatGPT (texte) rendent l’IA générative accessible au grand public
- 2023-2024 : explosion des modèles multimodaux (texte, image, audio, vidéo)

Ce que je dis souvent à mes étudiants en alternance développement informatique : l’IA générative n’est pas apparue par magie fin 2022. Elle est le fruit de décennies de recherche en mathématiques, en statistiques et en ingénierie informatique. Comprendre cette filiation permet de mieux appréhender les forces et les limites de ces outils que l’on utilise désormais au quotidien dans le développement logiciel.
Comme le souligne le Conseil national du numérique, la compréhension historique de l’IA est un enjeu de littératie numérique pour les professionnels comme pour les citoyens.
Quelle est la première intelligence artificielle de l’histoire ?
La réponse dépend de la définition que l’on retient du terme « intelligence artificielle ». Si l’on adopte une définition large, le Logic Theorist, créé par Allen Newell et Herbert Simon en 1956, est généralement considéré comme le premier programme d’IA. Ce logiciel était capable de démontrer automatiquement des théorèmes de logique mathématique tirés des Principia Mathematica de Bertrand Russell et Alfred North Whitehead.
Le Logic Theorist a été présenté à la conférence de Dartmouth, ce qui en fait un témoin direct de la naissance de l’expression « intelligence artificielle ». Il a réussi à démontrer 38 des 52 théorèmes du second chapitre des Principia, et a même trouvé une démonstration plus élégante que l’originale pour l’un d’entre eux.
D’autres candidats au titre de « première IA » méritent d’être cités :
- Le programme de dames d’Arthur Samuel (1952) : premier programme capable d’apprendre à jouer de mieux en mieux, précurseur du machine learning
- SNARC de Marvin Minsky (1951) : premier réseau neuronal artificiel simulé sur machine, avec 40 neurones et 3000 tubes à vide
- Le Perceptron de Frank Rosenblatt (1958) : premier réseau neuronal capable de reconnaître des formes visuelles simples
En réalité, il n’existe pas de consensus absolu sur « la » première IA, car la frontière entre un programme informatique sophistiqué et une véritable intelligence artificielle reste floue. Ce débat persiste encore aujourd’hui : est-ce qu’un modèle de langage « comprend » réellement ce qu’il écrit, ou ne fait-il que manipuler des probabilités statistiques ? La question posée par Turing en 1950 n’a toujours pas de réponse définitive.
Pour ceux qui souhaitent approfondir ces sujets en lien avec les métiers du numérique, le parcours de technicien informatique réseau intègre de plus en plus de compétences en IA appliquée aux infrastructures.
L’impact de l’expression « intelligence artificielle » sur le monde d’aujourd’hui
Soixante-dix ans après sa création, l’expression « intelligence artificielle » est devenue l’un des termes les plus utilisés dans le monde technologique. Son succès tient en partie à son ambiguïté volontaire : en associant « intelligence » (un concept humain, noble) à « artificielle » (un produit de l’ingénierie), McCarthy a créé une formule à la fois provocante et accessible.
Cette ambiguïté a des conséquences concrètes. Le terme « intelligence » génère des attentes parfois irréalistes chez le grand public. Beaucoup de personnes imaginent des machines dotées d’une compréhension comparable à celle d’un humain, alors que les systèmes actuels sont des IA étroites (narrow AI), performantes dans des tâches spécifiques mais incapables de raisonnement général.
Dans le monde professionnel, l’IA transforme profondément les métiers de l’informatique. En tant que formatrice, je vois cette transformation au quotidien dans mes cours de BTS SIO. Les compétences recherchées évoluent rapidement :
- Le chef de projet informatique doit désormais intégrer l’IA dans ses estimations de charge et ses choix techniques
- Les développeurs doivent comprendre les concepts de base du machine learning pour intégrer des API d’IA dans leurs applications
- Les profils en alternance informatique sont de plus en plus sollicités sur des projets impliquant de l’IA
La réglementation s’adapte également. L’AI Act européen, adopté en 2024 par l’Union européenne, constitue le premier cadre juridique global pour réguler l’intelligence artificielle. Il classe les systèmes d’IA par niveaux de risque et impose des obligations de transparence et de conformité. Comme le détaille le dossier de la CNIL sur l’intelligence artificielle, les enjeux de protection des données personnelles sont au cœur de cette régulation.
Pour les professionnels de l’IT, comprendre l’histoire de cette expression n’est pas qu’un exercice académique. Cela permet de prendre du recul sur les annonces marketing, de distinguer les avancées réelles des effets de mode, et de mieux anticiper les évolutions du secteur. L’IA n’est pas une révolution soudaine : c’est un processus continu qui dure depuis 1956, avec ses accélérations et ses ralentissements.
Cette perspective historique est d’autant plus importante pour ceux qui travaillent avec des outils d’infrastructure moderne. L’IA s’intègre désormais dans les pipelines DevOps, dans l’orchestration Kubernetes, et dans la sécurité informatique. Connaître les fondements permet de mieux exploiter ces outils.
À retenir
- L’expression « intelligence artificielle » date de 1956, proposée par John McCarthy pour la conférence de Dartmouth
- Les bases théoriques remontent à 1950 avec le test de Turing et aux travaux sur les neurones artificiels dès 1943
- L’IA a traversé deux hivers (1974-1980 et 1987-1993) avant sa renaissance grâce au deep learning
- Distinguez toujours les 4 types d’IA pour calibrer vos attentes sur un projet : réactive, mémoire limitée, théorie de l’esprit, conscience de soi
- L’IA générative que vous utilisez aujourd’hui repose sur l’architecture Transformer de 2017, pas sur une innovation de 2022
Questions fréquentes
Quand apparaît le terme intelligence artificielle ?
Le terme « intelligence artificielle » apparaît officiellement en 1955-1956. Il est utilisé pour la première fois dans la proposition de recherche soumise pour organiser l’atelier d’été de Dartmouth College. Le document a été rédigé fin 1955 par John McCarthy, Marvin Minsky, Nathaniel Rochester et Claude Shannon, et l’atelier s’est tenu durant l’été 1956. C’est cette date de 1956 qui est retenue comme naissance officielle de l’IA.
Quelle est la date de sortie de l’intelligence artificielle ?
L’intelligence artificielle n’a pas une « date de sortie » unique comme un produit commercial. La discipline est née en 1956 avec la conférence de Dartmouth, mais les premiers programmes d’IA (Logic Theorist, programme de dames de Samuel) existaient dès 1952-1956. L’IA telle que le grand public la connaît aujourd’hui, avec les modèles génératifs comme ChatGPT, a émergé fin 2022, soit plus de 66 ans après les premières recherches.
Qui a proposé le terme « intelligence artificielle » en 1956 ?
C’est John McCarthy, mathématicien et informaticien américain, qui a proposé le terme « artificial intelligence » pour nommer l’atelier de recherche de Dartmouth en 1956. Il souhaitait créer un champ de recherche distinct de la cybernétique de Norbert Wiener. McCarthy a ensuite créé le langage LISP en 1958 et a reçu le prix Turing en 1971 pour l’ensemble de ses contributions à l’informatique.
Qui est à l’origine de l’intelligence artificielle ?
L’intelligence artificielle est le fruit du travail de plusieurs pionniers. Les quatre fondateurs reconnus sont John McCarthy, Marvin Minsky, Nathaniel Rochester et Claude Shannon, co-auteurs de la proposition de Dartmouth en 1956. Mais Alan Turing (test de Turing, 1950), Warren McCulloch et Walter Pitts (neurone artificiel, 1943), et Norbert Wiener (cybernétique, 1948) ont posé les bases théoriques indispensables avant la conférence fondatrice.
Quelle est la première intelligence artificielle ?
Le Logic Theorist, créé par Allen Newell et Herbert Simon en 1956, est généralement considéré comme le premier programme d’IA. Il était capable de démontrer automatiquement des théorèmes mathématiques. Le programme de dames d’Arthur Samuel (1952), capable d’apprendre par l’expérience, est un autre candidat sérieux au titre de première IA, selon la définition retenue.
Quels sont les 4 types d’intelligence artificielle ?
Les 4 types d’IA sont : l’IA réactive (qui réagit sans mémoire, comme Deep Blue), l’IA à mémoire limitée (qui utilise des données récentes, comme les voitures autonomes et ChatGPT), l’IA à théorie de l’esprit (encore théorique, capable de comprendre les émotions humaines), et l’IA consciente (hypothétique, dotée d’une conscience de soi). Seuls les deux premiers types existent réellement aujourd’hui.
Formatrice IT indépendante depuis 2016, ancienne étudiante BTS SIO SLAM. 6 ans d'expérience en entreprise.