산학협력단 로고

지식재산권 지식재산권/사업화

SOONCHUNHYANG INDUSTRY-ACADEMY COOPERATION FOUNDATION

홈아이콘

지식재산권

바이트열 데이터를 이용한 언어 모델 학습 장치(language model learning device using bytes data)

권리구분
특허
출원일자
2021-02-25
출원번호
10-2021-0025287
등록일자
등록번호
법적상태
공개
발명자소속
발명자
정영섭 | 우지영 | 강아름
대표출원인
순천향대학교 산학협력단
단독출원여부
Y
특허 상세보기
링크 바로가기
비고
요약
본 발명은 바이트열 데이터를 이용한 언어 모델 학습 장치를 개시한다. 본 발명의 일 측면에 따른 바이트열 데이터를 이용한 언어 모델 학습 장치는, 파일 내에서 바이트열 데이터를 추출하는 추출부; 및 상기 추출된 바이트열 데이터에서 미리 설정된 개수만큼의 토큰을 입력 데이터로 선택하고, 선택된 입력 데이터를 이용하여 언어 모델을 학습시키는 언어 모델 학습부;를 포함한다.