홈
자연어 처리 (NLP)
자연어처리(NLP) 개요
텍스트 전처리(Text Preprocessing) 개요
토큰화(Tokenization) 개요
한국어 토큰화가 어려운 이유(형태소 분석기 vs BPE)
서브워드 토큰화(Subword Tokenization)와 BPE(Byte-Pair Encoding)
원-핫 인코딩(One-hot Encoding)과 한계
미니배치(mini batch) 생성과정
주요 자연어처리 Task
자연어 이해 (NLU)
벡터화 방식의 두 갈래(Sparse, Dense)
워드 임베딩(Word Embedding) 개요
토큰화·벡터화·임베딩 표 (한 눈에 보기)
유사도 (Similarity) 개요
RNN(Recurrent Neural Network)이란?
RNN의 한계와 Gated RNN의 등장
[이론] 텍스트 분류(text classification) 정리
[실습] 텍스트 분류(text classification) 코드 정리
자연어 생성 (NLG)
퍼플렉시티(Perplexity)와 크로스엔트로피(Cross-Entropy) 관계
어텐션(Attention)과 티처포싱(Teacher Forcing)
Seq2seq(Sequence-to-Sequence)란?
어텐션(Attention) 메커니즘이의 개요
트랜스포머(Transformsers)의 개요와 Multi-Head Attention Concept
지식 그래프 & 온톨로지 (KG & Ontology)
학습 로드맵
PART 0 · 개념 기초
용어 정리 — 지식 그래프와 온톨로지 핵심 용어
지식 그래프(Knowledge Graph)란 무엇인가?
데이터를 '저장'하는 것과 '이해'하는 것의 차이
RDB vs GraphDB vs 온톨로지 — 세 가지 세계관 비교
CWA vs OWA — "모르면 거짓" vs "모르면 모름"
지식 표현(Knowledge Representation)의 흐름
지식 그래프가 LLM의 무엇을 보완하는가
팔란티어(Palantir) — 온톨로지 기반 플랫폼 사례
PART 1 · Neo4j & Cypher
Property Graph와 그래프 데이터베이스
Neo4j 환경 구축
Cypher 기본 문법
Cypher 고급 문법
인덱스·제약조건·APOC