About Espresso-P
Phrase+Functional Tag
구문태그는 문장에서 어절이 가지는 문장 성분을 말합니다. 구문태그는 크게 구문표지(Phrase Tag), 기능표지(Functional Tag), 기타표지로 이루어 집니다.
- 구문표지
- S [문장]
- Q [인용절]
- 인용부호("") 안에 들어 있는 두개 이상의 문장
- NP [체언구]
- 체언 (명사, 대명사, 수사)
- VP [용언구]
- 용언 (동사, 형용사, 보조용언)
- VNP [긍정 지정사구]
- 긍정 지정사 '이다'
- AP [부사구]
- 부사
- DP [관형사구]
- 관형사
- IP [감탄사구]
- 감탄사
- 기능표지
- SBJ [주어]
- 주격 체언구, 명사 전성 용언구, 명사절
NP_SBJ, VP_SBJ, S_SBJ - OBJ [목적어]
- 목적격 체언구, 명사 전성 용언구, 명사절
NP_OBJ, VP_OBJ, S_OBJ - CMP [보어]
- 보격 체언구, 명사 전성 용언구, 인용절
NP_CMP, VP_CMP, S_CMP - MOD [체언 수식어]
- 관형격 체언구, 관형형 용언구, 관형절
NP_MOD, VP_MOD, S_MOD - AJT [용언 수식어]
- 부사격 체언구, 문말어미+부사격조사
NP_AJT, VP_AJT, S_AJT - CNJ [접속어]
- 접속격 체언
NP_CNJ - INT [독립어]
- 체언
NP_INT
- SBJ [주어]
- 기타표지
- PRN [삽입어구]
- 삽입된 성분의 기능표지 위치에 표시
예: NP_PRN - X [의사구(pseudo phrase)]
- 인용부호와 괄호를 제외한 나머지의 부호나, 조사, 어미가 단독으로 어절을 이룰 때 그 구문표지 위치에 표시
예: X_CMP - L, R [부호]
- 인용부호나 괄호의 구문표지 위치에 표시
왼쪽 부호에는 L을, 오른쪽 부호에는 R을 표시 - Q, U, W, Y, Z [인용절]
- 인용부호("")에 이끌려 나온 두 개 이상의 인용절을 대신하여 표기되는 부호
- PRN [삽입어구]
Dependency parses
구문분석은 문장 안에서 문장성분들의 관계를 찾는 과정입니다.
품사태깅과 더불어 자연어처리 분야의 기초적이고 필수적인 단계 중 하나입니다.
Espresso P의 특징은 다음과 같습니다.
- 구문태그를 이용
- 빠른속도, 강건함, 성능
- 21세기 세종계획의 구문코퍼스를 바탕으로 분석
API
Espresso-P는 현재 json형식으로 API를 제공하고 있습니다.
- URL : https://air.changwon.ac.kr/~airdemo/parser/API.php
- Parameters
- s : 분석 할 문장
https://air.changwon.ac.kr/~airdemo/parser/API.php?s=나는 집에 갔다.
- Example requests
sen: 입력 문장{
sen: 나는 집에 갔다.
result: [
[1, 나는, 나/NP+는/JX, NP_SBJ, 3],
[2, 집에, 집/NNG+에/JKB, NP_AJT, 3],
[3, 갔다, 가/VV+았/EP+다/EF+./SF, VP, 3]
]
}
result: [어절번호, 어절, tagging결과, 구문태그, 지배소어절]