Skip to content

Latest commit

 

History

History
177 lines (98 loc) · 7.38 KB

crCRIHN2023-12-12.md

File metadata and controls

177 lines (98 loc) · 7.38 KB

Séminaire fin d’année HNU

Les texte est un matériaux composite.

Considérer les dialogues comme des séquence. Un objet hétérogène, modulaire mais cohérent. Cohérence qui ne dépend pas des conditions morpho-syntaxiques.

Jean-Michel Adam, organisation micro-linguistique / macro-linguistique. Structure organisationnelle des textes

Les textes comme les discours sont des productions langagières, mais très dépendantes du contexte de production. Discours, cadre de référence pour des actes illocutoires.

Caroline Meler ?? reproche à la rhétorique

Saisir le genre du discours comme fonction sociale.

Discours rhétorique, un macro acte de langage. Acte illocutoire, relève de la culture, du social, etc.

Distant reading, Moretti début années 2000. Pour Ted Underwood pas strictement associé aux DH. L’interprétation quantitative de la lecture plutôt liée à l’histoire du livre et critique littéraire. Ne repose pas fondamentalement sur le numérique. Pratique d’enquête historique basée sur échantillons de textes. Conclusions arrivent après données. Réalisée depuis le 19e siècle.

Méthodes d’enquêtes. Manière des sciences sociales. Identification, publication cible. Valider concept à travers les données. Calcul d’indice. Corrélations.

Moretti : Opérationnalisation, construction d’un pont entre le concept et la mesure

TAL, Distant reading et genre littéraire

Discussion

De mon point de vue, la fiche répond à ce que propose Caroline Meler. Une convention établie que tout le monde utilise. Dès lors il est possible de formaliser la convention. Cf Hendricks sur les lettres privées portugaises. On va toujours retrouver un certains nombre de formules. Un ensemble de parties qui font partie du corps de la lettre, plus informelle.

Idée de pouvoir réutiliser ce que nous faisons. Le numérique nous met dans une situation d’une profusion d’écrits et de récits. Donc nécessaire de trouver une manière de segmenter ces contenus pour pouvoir les exploiter.

Question des systèmes experts. Potoski et l’analyse des lettres. Reconnaissance des parties avant de faire l’analyse lexicale.

Doit aborder nos objets avec une perspective de sciences sociales. Souvent regarde ce que peut faire l’outil et se dit que ne fait pas ce que voudrait qu’il fasse. Mais l’outil fait ce que pour quoi il a été conçu.

Suppose que pas de barrière technologique.

Soufiane, Exploring authorship attribution and the Censorship Question in Shakespeare

Coup d’œil sur potentiel premier chapitre de sa thèse.

IA donc survol.

Modélisation du langage, présence sensationaliste. Emphase sur la manière approche pourrait être fautive. Mon objectif présenter vue générale et situer dimension théorique de ma thèse dans cet espace.

6 disciplines associées IA. Associera à chaque domaine

  • machine learning
  • neural network : reconnaissance image
  • computer vision : reconnaissance dans les images
  • congnitive computing : Watson
  • nlp
  • deep learning

En réalité champs qui présentent de nombreux recouvrements. Plusieurs partagent domaine d’application. Souvent liés entre eux.

Différentes sphères reliées.

2 censorhip

Concept présente des difficultés conceptuelles. Instances de répression. Plusieurs biais.

Considère que souvent liés à l’Église, etc. En réalité plus complexe.

Utilisation classique outils insuffisante.

History of authorship attributions

Problèmes différents. Sentiment Analysis. Pb sarcasmes, etc.

Attribution auteur pb. Modèle principalement déterministe. Pas en mesure de rendre compte variation du style auteurs au cours du temps, particulièrement dans le cas de Shakespeare.

Nouvelles approches pour analyser style, etc. Stylométrie, analyse features. Analyse sémantique, etc. Analyse lexicale. Réduction lemmatisation.

Ce que propose quelque chose qui couvre le gap entre IA et NLP, etc.

Vectorisation.

Espace de reseaux neuronaux. Captation signification du mot d’après le prochain. Sans tokenization, etc.

Méthode de clusterisation multiples.

Comment faire confiance à Shakespeare

utilisation texte generation et text Processing pour entraîner le programme

Démo

Tensor Flow.

Character-to-Numerical-ID mapping

Tokenization du texte. Conversion en vecteurs.

Prépare le texte pour l’analyse

Fragmentation --> cibles séquence input et output. Pour apprendre le texte.

Revenir un caractère en arrière. Et target ce que le réseau supposé apprendre.

Discussion

Quid de cette division 6 domaines

  • fuzzy logicl
  • nlp
  • ml
  • robotics
  • neural network
  • expert system

Louis Olivier

Cognition critique.

Luciana Parisi, automatisation de l’automatisation.

Pierre de touche de la computation critique. Modalité particulière de la pensée artiificelle.

Katherine Hayles, écologies cognitives

  • pensée conscience
  • cognition non conssciences
  • processus...

Pas de hiérarchie. Place inscription matérielle.

Les machines peuvent-elles penser ? Réserve cet usage aux entités conscientes.

Parisi conteste privilège humain de la conscience.

Modes de raisonnement de Pierce

  • déduction
  • induction
  • abduction

Machines, ouvertures vers des formes de raisonnement inédite. Oui les machines peuvent penser. Mais plus intéressant articuler l’argument autrement. Ne pensent pas car pas conscientes mais peuvent faire autres choses.

Reconnaître pratiques non-conscientes. Mais aussi considérer place de la pensée dans la cognisphère.

Organisme vivant ou non vivant peu d’importance. N’apporte rien compréhension des systèmes complexes. Apporte hiérarchie pas souhaitable.

Emprise sur le monde. Anthropocentrisme et cognisphère.

Vaste ensemble de réseau cognitif

  • instrumentation.
  • matérialité des savoirs

Hayles beaucoup mis l’accent sur les savoirs situés dans leur emboîtement. Beaucoup insisté sur le fait qu’un savoir situé serait différent. S’inspirer de la natre intéressant pour répondre à la question. Quand les abeilles équidistantes, débutent à recracher de la cire pour produire forme hexagonale. Clairement quelque chose qui ne relève pas de la conscience. Mais proximité matérielle, environnement toujours essentielle. Comme chercheurs toujours important de considérer les vrais contours de ce dont considère avoir besoin. Turing, dit que peut écrire dans la conscience d’un enfant comme dans un calepin blanc. Contours de l’individus enfant, alors que nous avons évolués comme espèce. Hérite aussi de toute une lignée d’espèces. Procesus matériels dont hérite. Capacité d’apprendre qui est uun acquis. Contours de l’enfant flous. Material processes.

Inverted qualia

https://plato.stanford.edu/entries/qualia-inverted/

penser la conscience avec d’autres ingrédients.

quid des affects et des sentiments des machines. Cognisphère doit-elle être complétée par émotions ? Sentiment certain.

Narration numérique

Processus de construction d’un récit autour de données et de leurs...

Comparer narration ancienne et nouvelle.

  • en quoi ressemble-t-elle et se distingue ?
  • quels précurseurs et qu’en tirer ?
  • similarité avec les jeux sportifs
  • quelles idées dans littérature classique ?

Nouveaux médias remontent pratique avant écriture. Polinalli (connexion passé présent et futur = construction d’un narratif).

Symbolisme mythologique. Fêtes Dionysos.

Joseph Campbell

Caroline Miller, digital storytelling. Enjeux des avatars.