Természetes nyelvek feldolgozása
Last updated on 2020.11.16.
Tüzes Izabella
Megoldásaink, Távközlés, Informatika, Bank Biztosító, Ipar, Mezőgazdaság, Logisztika, HR
Digitalizálja a papírmunkát mesterséges intelligenciával
Minden szervezet (vagy egyén) rendelkezésére álló digitális információ legnagyobb részhalmaza az emberi szöveg, számtalan logikai és fizikai formátumban. E strukturálatlan, szabad és kétértelmű információk természetéből adódóan ezeket a dokumentumokat a számítógépek meglehetősen nehezen értik, következésképpen ta számítógépes feldolgozás szempontjából többnyire kihasználatlanok. A természetesenyelv-feldolgozásnak nevezett adattudományi részterület minden jelenlegi fogyatékossága ellenére sok hasznos információkat tudunk kivonni a szövegekből.
A gépi tanulás alkalmazásával különböző szempontok alapján tudjuk osztályozni őket: milyen nyelven íródott; mi az uralkodó érzelmi hangulata; milyen témák kapcsolódnak hozzá. Ezeken az alapvető kategorizálásokon kívül további lényegi információkat is kinyerhetünk. Például azonosíthatjuk a különböző entitásokat (személyeket, intézményeket, földrajzi helyeket) és a közöttük fennálló kapcsolatot. Alternatív megoldásként lehetőség van bármely hosszabb dokumentum rövid összefoglalásának elkészítésére, ezzel sok idő megspórolható az olvasó számára, hisz csak azt kell elolvasnia, ami valóban lényeges.
Példa
Egy terjedelmes Merger & Acquisition-típusú jelentésből kinyerhetjük, mely vállalatok érintettek benne: melyik a felvásárló, a felvásárolt, mikor ment végbe a tranzakció. Természetesen az ilyen alapinformációkon túl a vizsgálat kiterjeszthető további adatokkal is egyéb forrásokból: milyen iparágban érintettek az entitások, mi a fő profiluk, mennyire nyereségesek, kik a vezető tisztségviselőik, stb.
Hozzáadott érték: papír alapú szöveges dokumentumok automatizálásval csökkenthetőek az adminisztratív költségek és a ráfordított idő is.
Ajánlott Tech Stack: Linux, Python (Anaconda), Scikit-learn, NLTK, gensim, TensorFlow, PyTorch
Tartalomkereső
Tech Stack
Android
Angular
Apache
Automata Tesztelés
Backend
Bbase
C++
Camunda
Centura
Cloud
digitalizáció
Docker
EAPware
Frontend
Gitlab
Hadoop
IoT
Ipar 4.0
Java
JavaScript
JIRA
Linux
Load tesztelés
M2M
MariaDB
Mesterséges intelligencia
Microservice
MySQL
NLTK
Node.js
NodeJS
OpenWRT
Oracle
PHP
PLC programozás
PostgreSQL
Python
Python
PyTorch
RASA
Scikit-learn
Spring
TensorFlow
VUE
Üzleti Elemzés