구글 검색엔진 알고리즘 변천사- 사용자의 의도를 파악하는 지능형 검색엔진으로 진화
- PageRank 소개
- 1996년 구글 창업자인 Larry Page와 Sergey Brin이 개발한 PageRank는 웹페이지의 중요도를 결정하는 알고리즘으로 1998년 구글의 검색엔진에 도입됨
- 구글의 검색 메커니즘에는 PageRank가 존재하나 구글 검색에서 사용하는 약 200여 가지의 검색 알고리즘 중 하나임
- PageRank는 구글이 최초로 적용한 검색 알고리즘이라는 상징적인 의미로 중요성을 가짐
- PageRank는 ‘중요한 웹 사이트는 다른 웹 사이트로부터 많은 링크를 받는다.’라는 가정아래 특정 웹페이지의 rank를 부여하는 알고리즘
- rank는 확률값으로 0과 1사이의 값인데, 예를 들어 ‘A웹 페이지가 0.5의 rank 값을 갖는다.’가 의미하는 바는 어떤 사람이 랜덤하게 링크를 클릭하여 50% 확률로 A웹 페이지로 이동하는 것을 말함
- 댐핑 팩터(damping factor)를 도입하여 다른 웹페이지로의 링크가 없는 웹페이지에 도달할 경우, 그 다음은 모든 웹페이지를 접근할 수 있는 확률을 부여함
- PageRank는 고유벡터(eigenvector)값으로 구할 수 있음(3)
- 웹페이지의 관계와 댐핑 팩터를 고려한 정방행렬의 최대 고유치(maximum eigen- value)에 대한 고유벡터로 PageRank값을 구할 수 있음
-
- 구글의 검색엔진 알고리즘은 양질의 검색결과를 제공하기 위해서 특히 인공지능을 활용하여 사용자의 검색의도를 파악하고, 웹 사이트의 속성과 질을 분류