Text summarization with TensorFlow

Text summarization with TensorFlow

https://research.googleblog.com/2016/08/text-summarization-with-tensorflow.html

 

Google이 기사 요약문 제목을 작성하는 인공 지능의 능력을 공개했다. Google 브레인 팀의 소프트웨어 엔지니어 피터 류 (Peter Liu) 씨는 8 월 24 일, Google 리서치 공식 블로그에 “텐사 흐름 라이브러리를 사용하여 텍스트 요약 ( Text summarization with TensorFlow ) ‘라는 기사를 게재했다.

“요약은 기계 판독하는 능력을 지원한다. 요약을 해내 기 기계 학습 모델은 문서에서 중요한 정보를 추출하는 것이 필요하지만, 이것은 컴퓨터에는 매우 보람있는 일이다”(피터 리우 )

류 씨 등 연구팀은 기계 학습에 의한 텍스트 요약을 위해 시도한 몇 가지 방법에 대해 설명하고있다. 예를 들어 “앨리스와 밥은 열차를 타고 동물원에 갔다. 그들은 아이의 기린, 사자, 형형색색의 열대 조류의 무리를 보았다 ‘라고하는 원문이 주어 졌을 때, 그 각각의 접근 방식을 통해 다른 결과 이 나온다는 설명이다.

방법 중 한가지는 텍스트 마이닝 분야의 ” 역 문서 빈도 (IDF) ‘과 같은 지표를 활용하여 문서의 중요 보이는 부분을 추출하고 그것을 요약하는 방식이다. 이 방법은 “앨리스와 밥은 동물원에 간다. 새떼를 보았다 ‘라는 결과가되었다. 이러한 발췌 방법이라고 문법적으로 이상한 느낌이 든다.

다른 하나는 본문의 일부를 강제로 발췌해야하는 바람이 아닌 내용을 어느 정도 다시 보게 방식이다. 이른바 ‘추상적 요약 (abstractive summarization) “라고 명명 된 접근 방식을 적용한 결과는 다음과 같이되었다.

“앨리스와 밥은 동물원에 가서 짐승이나 새를 보았다 ‘

류 씨는 “이 경우, 우리는 비슷한 분량의 단어 더 많은 정보를 저장하기 위해 원문에없는 단어를 이용한 (중략) 추상적 요약이 더 좋은 방법임을 분명했다 」라고하고있다.

Leave a Reply

Your email address will not be published. Required fields are marked *