우선 네이버 연관어검색 이라는 부분에 대해서는 nhn에서 특허를 가지고있다.
특허내용을 살펴보자면...
![]() | 연관 검색 쿼리 추출 방법 및 시스템 (METHOD AND SYSTEM FOR IDENTIFYING RELATED SEARCH TERMS IN THE INTERNET SEARCH SYSTEM) | |
![]() | 엔에이치엔(주) 서울특별시 강남구 역삼동 (대한민국) | |
![]() | 최재걸 서울특별시관악구봉천동 (대한민국) 문상준 서울특별시송파구거여동 (대한민국) 최병엽 서울특별시중랑구묵동 (대한민국) 이준호 서울특별시송파구송파동 (대한민국) | |
![]() | 본 발명은 상호 연관된 검색 쿼리(query)를 추출하는 방법 및 시스템에 관한 것으로서, 더욱 상세하게는 각 검색 쿼리가 입력된 IP 주소의 수와 상기 검색 쿼리를 포함하는 검색 쿼리의 쌍이 입력된 IP 주소의 수를 측정하고, 이를 이용하여 검색 쿼리 간 연관 여부를 판단할 수 있는 연관 검색 쿼리 추출 방법 및 시스템에 관한 것이다. 본 발명에 따른 연관 검색 쿼리 추출 방법은 IP 주소 및 상기 IP 주소를 통하여 수신된 검색 쿼리에 관한 레코드를 포함하는 데이터베이스를 유지하는 단계(상기 레코드는 소정의 시간 간격 마다 생성되어 상기 데이터베이스에 기록됨), 상기 데이터베이스를 참조하여 상기 시간 간격 당 제1 검색 쿼리가 수신된 IP 주소의 수를 카운팅(counting)하여 제1 IP 주소 수 정보를 생성하는 단계, 상기 데이터베이스를 참조하여 상기 시간 간격 당 상기 제1 검색 쿼리 및 제2 검색 쿼리가 수신된 IP 주소의 수를 카운팅하여 제2 IP 주소 수 정보를 생성하는 단계, 상기 제1 IP 주소 수 정보 및 상기 제2 IP 주소 수 정보를 이용하여 조건부 확률(conditional probability) 정보를 생성하는 단계, 및 상기 조건부 확률 정보에 기초하여 상기 제1 검색 쿼리 및 상기 제2 검색 쿼리 간 연관 여부를 판단하는 단계를 포함하는 것을 특징으로 한다. 본 발명에 따르면, 사용자로부터 입력 받은 검색 쿼리에 관한 데이터를 효과적으로 수집, 분석하여 검색 쿼리 간 연관 여부를 자동적으로 판단함으로써 정확한 연관 검색 쿼리를 신속하게 추출하여 보다 질 높은 서비스를 사용자에게 제공할 수 있는 연관 검색 쿼리 추출 방법 및 시스템이 제공된다. | |
![]() | 상호 연관된 검색 쿼리(query)를 추출하는 방법에 있어서, IP 주소 및 상기 IP 주소를 통하여 수신된 검색 쿼리에 관한 레코드를 포함하는 데이터베이스를 유지하는 단계 - 상기 레코드는 소정의 시간 간격 마다 생성되어 상기 데이터베이스에 기록됨 -; 상기 데이터베이스를 참조하여 상기 시간 간격 당 제1 검색 쿼리가 수신된 IP 주소의 수를 카운팅(counting)하여 제1 IP 주소 수 정보를 생성하는 단계; 상기 데이터베이스를 참조하여 상기 시간 간격 당 상기 제1 검색 쿼리 및 제2 검색 쿼리가 수신된 IP 주소의 수를 카운팅하여 제2 IP 주소 수 정보를 생성하는 단계; 상기 제1 IP 주소 수 정보 및 상기 제2 IP 주소 수 정보를 이용하여 조건부 확률(conditional probability) 정보를 생성하는 단계; 및 상기 조건부 확률 정보에 기초하여 상기 제1 검색 쿼리 및 상기 제2 검색 쿼리 간 연관 여부를 판단하는 단계를 포함하고, 상기 조건부 확률 정보에 기초하여 상기 제1 검색 쿼리 및 상기 제2 검색 쿼리 간 연관 여부를 판단하는 상기 단계는, 상 기 조건부 확률 정보가 소정의 수치 이상인 경우에 한하여 상기 연관 여부를 판단하고, 상기 수치는 상기 제1 IP 주소 수 정보를 변수로 하는 소정의 함수에 기초하여 변동되며, 상기 함수는 100 퍼센트를 상기 제1 IP 주소 수 정보의 제곱근으로 나눈 퍼센티지 값을 함수값으로 갖는 함수인 것을 특징으로 하는 연관 검색 쿼리 추출 방법. | |
![]() | 1개 ![]() | |
![]() | 검색 쿼리, 연관, 조건부 확률 정보, 상관 관계 정보, 연관 지수 정보 |
이게 특허의 내용이다..
즉 , 스타일난다, 스타일스토리, 로토코 등등의 인기 키워드를 검색하였을 때 오른쪽에 연관된 키워드로 나오는 것은 해당키워드와 함께 많이 조회를 했다는 말이고.. 동일 ip가 아닌.. 여러 지역의 컴퓨터에서.. 많은 사람들이 조회를 했다고 보기 때문에.. 등록이 되는것이다.
직접 테스트 결과... 스타일난다 키워드의 경우에 연관검색어로 등록이 되어있을 때 1일 유입량은 450~700트레픽 사이였다. 즉 평균 5~600명정도가 연관어를 타고 들어온다는 것이다.
적을땐 300명도 들어온다. 가끔
스타일난다 키워드 조회수가
스타일난다 | 894,363 |
즉, 500명씩 30일인 경우 15,000명이 유입 된다고 치자. 그럼 결과는 1.6%정도이다.
검색어의 연관어로 등록이 되어있는 경우 평균적으로 1.6%정도의 유입량을 보인다..
즉, 10개의 키워드가 등록이 가능하므로 16%정도가 연관검색어로 유입된다고 볼수있겠다.
물론.. +-오차가 5%정도 되리라고 본다.
어찌 되었던.. 하루에 스타일난다에 가서 옺을 사려는 이용자중에 1.6%가 연관검색어로 빠진다는것.
오버추어 광고를 한다고치자! 100원짜리광고를 하루에 500명이면.. 얼마? 50,000원이구나..
한달이면? 150만원정도...
그런데..
웬만한 키워드들은 특히나, 여성의류 쪽이나. 스타일난다 스타일의 옺을 찾는 여성들의 키워드들은 가격이 당근 비싸다. 훨씬...
두서 없이 대략 쓴거같다..
잘만 활용하면..좋은 광고가 될수도 있다는 말을 하고싶었다....
참고로, 연관어검색은 업체명은 가능하지만 카테고리명은 대게 불가능하다.
즉, 여성의류, 남성의류, 다이어트 등등의 키워드들은 불가능하다는 이야기다.
네이버가 바보가 아닌이상 이점은 당연히 막아놓았겠지...ㅡㅡ;
동일 키워드 시장에서 가장유명한 업체명에 연관검색어가 붙는것은 99%가 가능하다.