• 홈
  • 자연어 처리 (NLP)
    • 자연어처리(NLP) 개요
    • 텍스트 전처리(Text Preprocessing) 개요
    • 토큰화(Tokenization) 개요
    • 한국어 토큰화가 어려운 이유(형태소 분석기 vs BPE)
    • 서브워드 토큰화(Subword Tokenization)와 BPE(Byte-Pair Encoding)
    • 원-핫 인코딩(One-hot Encoding)과 한계
    • 미니배치(mini batch) 생성과정
    • 주요 자연어처리 Task
  • 자연어 이해 (NLU)
    • 벡터화 방식의 두 갈래(Sparse, Dense)
    • 워드 임베딩(Word Embedding) 개요
    • 토큰화·벡터화·임베딩 표 (한 눈에 보기)
    • 유사도 (Similarity) 개요
    • RNN(Recurrent Neural Network)이란?
    • RNN의 한계와 Gated RNN의 등장
    • [이론] 텍스트 분류(text classification) 정리
    • [실습] 텍스트 분류(text classification) 코드 정리
  • 자연어 생성 (NLG)
    • 퍼플렉시티(Perplexity)와 크로스엔트로피(Cross-Entropy) 관계
    • 어텐션(Attention)과 티처포싱(Teacher Forcing)
    • Seq2seq(Sequence-to-Sequence)란?
    • 어텐션(Attention) 메커니즘이의 개요
    • 트랜스포머(Transformsers)의 개요와 Multi-Head Attention Concept
  • 지식 그래프 & 온톨로지 (KG & Ontology)
    • 학습 로드맵
    • PART 0 · 개념 기초
    • 용어 정리 — 지식 그래프와 온톨로지 핵심 용어
    • 지식 그래프(Knowledge Graph)란 무엇인가?
    • 데이터를 '저장'하는 것과 '이해'하는 것의 차이
    • RDB vs GraphDB vs 온톨로지 — 세 가지 세계관 비교
    • CWA vs OWA — "모르면 거짓" vs "모르면 모름"
    • 지식 표현(Knowledge Representation)의 흐름
    • 지식 그래프가 LLM의 무엇을 보완하는가
    • 팔란티어(Palantir) — 온톨로지 기반 플랫폼 사례
    • PART 1 · Neo4j & Cypher
    • Property Graph와 그래프 데이터베이스
    • Neo4j 환경 구축
    • Cypher 기본 문법
    • Cypher 고급 문법
    • 인덱스·제약조건·APOC