GLUE Benchmark

기타 메모

GLUE Benchmark

Jonchann 2019. 3. 31. 15:30

General Language Understanding Evaluation (GLUE) 지표는 자연언어이해를 위한 시스템을 훈련, 평가, 분석하기 위한 데이터를 모아놓은 것이다. GLUE에는 아래 항목이 포함되어있다:

9개 문장 혹은 문장 쌍의 지표는 현존하는 데이터셋에 기반하고 있으며 폭 넓은 데이터셋의 크기, 장르, 난이도를 망라할 수 있도록 선택되었다.
데이터셋(진단셋)은 넓은 범위의 자연언어를 대상으로 하는 모델을 평가하고 분석할 수 있도록 설계되었다.
지표의 성능을 추적하는 공적인 리더보드와 진단셋을 바탕으로 하는 모델의 성능을 가시화하는 계기판이 있다.

GLUE 지표는 모델에 구속받지 않기(model-agnostic) 때문에 어떤 시스템도 문장/ 문장 쌍을 처리할 수 있고 이에 상응하는 예측값을 내놓을 수 있다(eligible to participate). 평가(benchmark) 태스크는 파라미터 공유 혹은 전이 학습 기술 전반에(across) 정보를 공유하는데 활용하는 모델을 뒷받침하기(favor) 위해(so as to) 선택되었다. GLUE의 궁극적인 목표는 일반적이고 탄탄한 자연언어 이해 시스템의 개발 연구를 이끌어가는 것이다.

저작자표시 비영리 변경금지

'기타 메모' 카테고리의 다른 글

master에 merge한 수정사항을 다시 돌릴 때: revert (0)	2021.06.04
VSCode에서 git worktree로 같은 리포지토리 다른 브랜치 작업 병행하기 (0)	2021.05.27
A/B테스트 결과 분석에 앞서 확통 개념 정리 (0)	2021.02.04
Alfred workflow 에서 spotify 제어하기 (0)	2018.12.17
oh my zsh! (0)	2018.12.11

현재글GLUE Benchmark

MAGICPIE

비전공자가 정보영역 대학원에 들어와서 이대로는 안되겠다 싶어 개설한 블로그. 정보전달이 절대 목적이 아닌 필기용 블로그임에 주의.

docker, git with command, servletmodule, TypeScript, 파이썬3 공부, AWSLambda실행기, numpy 쓰면 안되는 문제, AWS ECR, AWS IAM 정책 역할, numpy basics, github, git, AWS Elastic Container Registry, AWS설명서, 이미 push한 commit 고치기, Web API, AWS Lambda, AWS CDK 에러, URI, github소스읽기,

Today :
Yesterday :

MAGICPIE

GLUE Benchmark

'기타 메모' 카테고리의 다른 글

'기타 메모'의 다른글

티스토리툴바

« 2025/01 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

GLUE Benchmark

'기타 메모' 카테고리의 다른 글

'기타 메모'의 다른글

관련글

티스토리툴바