BERT

2023. 8. 3. 11:28·Deep learning/자연어처리

 

  • Tokenizer
    • BPE - Byte-pair Encoding - 전체 문서를 문자단위로 쪼갠 뒤 빈번하게 나오는 문자를 묶어 단어사전 수를 줄임.
      • '모', '델' 로 나누고  '모델'이 빈번하게 발생하면 '모델'로 붙여서 처리
    • 형태소는 이미 만들어놓은 형태소가 없으면 tokenizer 할 수 없다는 게 단점.

 

 

 

https://heekangpark.github.io/nlp/huggingface-bert

 

Huggingface BERT 톺아보기

Reinventing the Wheel

heekangpark.github.io

 

'Deep learning > 자연어처리' 카테고리의 다른 글

bert 모델 공부하기  (0) 2023.07.28
02. 전처리 : 토큰화  (0) 2022.09.06
01. 자연어 처리 개요  (0) 2022.08.17
트랜스포머 , GPT 코드 구현  (0) 2020.10.16
'Deep learning/자연어처리' 카테고리의 다른 글
  • bert 모델 공부하기
  • 02. 전처리 : 토큰화
  • 01. 자연어 처리 개요
  • 트랜스포머 , GPT 코드 구현
버터젤리
버터젤리
  • 버터젤리
    across the universe
    버터젤리
  • 전체
    오늘
    어제
    • 분류 전체보기 (128)
      • 데이터 엔지니어 (0)
        • MLOPs (0)
      • 인프라 및 클라우드 (0)
        • Docker (0)
        • Kubernetes (0)
      • Development(개발) (2)
        • 백엔드 (0)
        • 개발 Core (2)
      • LLM (4)
        • 강화학습 (0)
        • LLM (4)
        • Generator (0)
      • PM (7)
        • IT Trends (0)
        • 세미나 후기 (7)
      • Deep learning (30)
        • 기초이론 (8)
        • 컴퓨터비전 (6)
        • 자연어처리 (5)
        • Anomaly Detection (6)
      • Machine learning (25)
      • Computer Science (26)
        • Linux (21)
        • 네트워크 (1)
        • 하드웨어 (4)
        • 운영체제(OS) (0)
      • 프로그래밍 언어 (17)
        • Python (8)
        • Pytorch (8)
        • Tensorflow (0)
      • Tools (14)
        • 주피터노트북 (7)
        • 깃(Git) (2)
        • 파이참 (5)
      • Book (2)
      • LIFE (0)
      • 창고 (0)
        • AI 인턴 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    BN
    역할
    객체지향의사실과오해
    #git#github
    리눅스#파일이동#특정이름#포함
    jupyer notebook
    BatchNormalization
    @
    객사오
    객체지향
    batch normalization
    nohup
    백그라운드
    책임
    데코레이터
    역할과책임
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.1
버터젤리
BERT
상단으로

티스토리툴바