NLP 1. 자연어 처리 task
자연어 처리 task
Text Classification
단어, 문장 혹은 문서 단위의 텍스트에 사전 정의된 카테고리를 할당하는 작업
- Sentiment Analysis : 주어진 문장(text)의 감정을 분류
- Abusing Detection : 주어진 문장(text)의 어뷰징 여부를 판별
Information Retrieval or Document Ranking
두 문서나 문장 간 유사도를 결정하는 작업
0과 1사이의 숫자로 유사도를 결정하는 것
Text-to-Text Generation
텍스트를 입력으로 받아 목표를 달성하는 텍스트를 생성하는 작업
free-form 텍스트를 생성할 수 있는 작업인만큼 높은 확장성을 가지는 다양한 자연어처리 Tasks들이 포함되어 있음
-
Machine Translation Task
소스 언어의 텍스트를 의미를 유지한 채 타겟 언어의 텍스트로 번역 -
Text Summarization Task
텍스트 요약 작업 : 문서의 의미를 유지한 채 더 짧은 버젼의 텍스트로 요약- 추출 요약 (Extractive summarization)
- 추상 요약 (Abstractive summarization)
-
Text Generation Task
Machine Translation, Text Summarization 모두 이 작업에 포함 가능
포괄적인 관점에서, 사람이 작성한 것 같은 텍스트를 생성하는 작업 -
Knowledge bases, entities and relations
지식 기반 혹은 의미론적인 entity나 관계를 파악하는 NLP 분야
- Named Entity Recognition (NER)
의미론적인 두 개의 entity 간 관계를 식별하는 작업entity : 개체, 사람이 생각하는 개념이나 정보 단위와 같은 대상체, 구별이 됨
- Relation Extraction Task
텍스트에서 의미론적인 관계를 추출하는 작업
주어나 목적어 같은 것을 추출함
-
Topics & Keywords
주제나 키워드를 파악함 -
Chatbot
-
Text Reasoning
주어진 지식이나 상식을 활용하여 일련의 추론 작업을 수행
간단한 수학문제들을 푼다고 생각 :
계산과정 -> 답, 이런 계산을 추론이라고 함 -
Fake News & Hate Speech Detection
허위, 오해의 소지가 있는 정보가 포함된 text를 감지하고 filtering -
Text-to-Data & vice-versa
STT, TTS 작업이나, Text-to-Image 등