Skip to content
@cuban-digital-language

cuban-digital-language

Como es el español digital cubano❓

1- Mineria de datos :

  • redes sociales
    • Twitter (Scrapper) ✅
    • Youtube (API) ✅
    • CubaDebate (Scrapper) ✅
    • Facebook (Scrapper) ✅
    • Instagram
    • Whatsapp
    • Telegram ✅
    • Revolico
  • Corpus de la RAE (pyrae❓)

2- Análisis de palabras ajenas a la RAE:

  • Cantidad de diminutivos
    • Como reconocer diminutivos y sus significados
      • IA❓ Se puede hacer un modelo que dadas las principales reglas generadoras de diminutivos infiera el significado?
  • Cantidad de palabras de otros ideomas (inicialmente el ingles)
    • Corpus equivalente a la RAE en ingles?
  • Cantidad de faltas de ortografía:
    • IA❓ Un modelo que se aprenda los distintos corpus y dada un error diga la palabra real?

3- Análisis de texto:

  • Aplicar un MRI (Modelo de Recuperación de Información) sobre el corpus de todos los textos recolectados (SRI🔍📰)
  • Con la información de la RAE, los diminutivos, las faltas y las palabras en ingles generar un thesaurus (SRI🔍📰)
  • Dado una consulta hacer expanción de consulta apoyado en el thesaurus y recuperar los textos más relevantes (SRI🔍📰)
  • Dado el corpus de comentarios automatizar la generación de nuevos comentarios (IA🧠💻)
  • Mezclar los comentarios generados con los recuperados y proponer al lector detectar la IA (PD 📰🧑🏿‍💻)
  • Obterner retroalimentación del juego tanto para el SRI como para la IA
  • Empleando detección de contenidos y clustering generar curpos de prueba para evaluar el SRI (IA🧠💻)

4- Artículo de Periodismo de Datos y posicionamiento del repo

  • Usar las técnicas de SEO para ganar posicionamiento del artículo y de esta organizacion y sus repos (SRI🔍📰)

Pinned Loading

  1. methodology methodology Public

    List of documents that explain each of the organization's jobs

    1

  2. Models-for-Information-Retrieval Models-for-Information-Retrieval Public

    Some models for information retrieval in Spanish text corpus of the Cuban social network

    Python

  3. nlp-probabilistic-text-generator nlp-probabilistic-text-generator Public

    🤖Machine Learning model to generate text. It uses the structure and model of the language, and probabilistic tools such as Markov's chains and hidden processes.

    Jupyter Notebook

  4. nlp-rnn-text-generator nlp-rnn-text-generator Public

    🤖 Recurrent neural network to text generate

    Jupyter Notebook

  5. corpus-cluster-by-autoencode corpus-cluster-by-autoencode Public

    Python

  6. content-detection-and-corpus-clustering content-detection-and-corpus-clustering Public

    Jupyter Notebook

Repositories

Showing 10 of 19 repositories

Top languages

Loading…

Most used topics

Loading…