일반적으로 N 그램이라고도하는 Ngram은 텍스트 또는 음성 콘텐츠를 통계적으로 분석하여 엔 텍스트에있는 일종의 항목 (숫자).
검색 항목은 음소, 접두사, 구 또는 글자와 같은 모든 종류의 것들 일 수 있습니다. N 그램은 연구 커뮤니티 외부에서는 다소 모호하지만 다양한 분야에서 사용되며 개발자가 자연어를 이해하고 이에 대응할 수있는 컴퓨터 프로그램을 코딩하는 데 많은 영향을 미칩니다.
Google 도서 Ngram 뷰어의 경우 분석 할 텍스트는 Google이 공공 도서관에서 스캔하여 Google 도서 검색 엔진을 채우는 방대한 양의 책에서 나옵니다. Google 도서 Ngram Viewer의 경우 검색 할 텍스트를 신체 . Ngram Viewer는 언어별로 집계되지만 영어와 미국 영어를 별도로 분석하거나 함께 정리할 수 있습니다.
Ngram 작동 방법
-
books.google.com/ngrams에서 Google 도서 Ngram 뷰어로 이동하십시오.
-
분석 할 구 또는 문구를 입력하십시오. 각 구를 쉼표로 구분하십시오. Google은 "Albert Einstein, Sherlock Holmes, Frankenstein"을 제안합니다. 항목은 Google 웹 검색과 달리 대소 문자를 구분합니다.
-
기간을 입력하십시오. 기본값은 1800에서 2000입니다.
-
코퍼스를 선택하십시오. 외국어 텍스트 또는 영어를 검색 할 수 있으며 표준 선택 사항 외에도 하단에 "영어 (2009) 또는 미국 영어 (2009)"와 같은 것이 나타날 수 있습니다. 이것들은 Google이 이후 업데이트 한 오래된 자료이지만 이전 데이터 세트와 비교할만한 이유가있을 수 있습니다. 대부분의 사용자는이를 무시하고 가장 최근의 자료에 집중할 수 있습니다.
-
부드럽게 수준을 설정하십시오. 매끄럽게하기는 그래프가 얼마나 매끄러운지를 나타냅니다. 가장 정확한 표현은 0의 스무딩 레벨이지만,이 설정은 읽기 어려울 수 있습니다. 기본값은 3으로 설정됩니다. 대부분의 경우 조정할 필요가 없습니다.
-
눌러 많은 책 검색 단추.
Google에서는 Ngram 뷰어를 사용하여 상당히 상세하게 드릴 다운 할 수 있습니다. 명사를 물고기 대신에 동사를 검색하려면 태그를 사용하면됩니다. 이 경우 'fish_VERB'를 검색하면
Google은 사용할 수있는 명령의 전체 목록과 기타 고급 설명서를 웹 사이트에서 제공합니다.
Ngram은 무엇입니까?
Google 도서 Ngram 뷰어는 시간 경과에 따른 서적의 특정 구문 사용을 나타내는 그래프를 출력합니다. 두 개 이상의 단어 나 구를 입력하면 다른 검색어와 대비되는 색으로 구분 된 선이 표시됩니다. 이것은 Google 트렌드와 매우 유사하며 검색 만이 더 긴 기간을 포함합니다.
사례 연구
식초 파이의 사례 연구를 고려하십시오. 그들은 Laura Ingalls Wilder 's에 언급되어 있습니다. 대초원에 작은 집 시리즈. 식초 파이에 대해 자세히 알아보기 위해 Google의 웹 검색을 통해 그들이 미국 남부 요리의 일부로 간주되고 실제로 식초로 만들어 졌음을 알 수 있습니다. 그들은 모든 사람들이 일년 내내 신선한 농산물을 이용할 수없는 시대로 귀 기울입니다. 그러나 전체 이야기입니까?
에 대한 Google Ngram 뷰어 검색 식초 파이 그리고 여러분은 1800 년대 초반과 후반의 파이에 대한 언급, 1940 년대의 많은 언급, 그리고 최근 몇 차례의 언급이 있습니다. 그러나 3의 스무딩 레벨을 사용하면 1800 년대의 언급보다 고원을 볼 수 있습니다. 그 시간에 출판 된 책이 그리 많지 않고 데이터가 매끄럽게 설정되어 있기 때문에 그림이 왜곡됩니다. 아마 식초 파이를 언급 한 책이 있었을 것이고, 단지 스파이크를 피하기 위해 평균을 얻었을 것입니다. 평활화를 0으로 설정하면 이것이 사실 인 것을 알 수 있습니다. 스파이크는 1869 년을 중심으로, 1897 년과 1900 년에 또 다른 스파이크가 있습니다.
그 당시에는 식초 파이에 대해 아무도 이야기하지 않을 것 같지 않습니다. 그 곳곳에 떠있는 요리법이 있었지만 사람들은 그렇지 않았습니다. 쓰다 Ngram 검색에 대한 중요한 제한 사항입니다.