[개발일지] 230608 실시간 급상승 검색어 알고리즘
·
성장이야기/TIL
실시간 급상승 검색어 알고리즘 이전에 알아봤던 랭킹 알고리즘을 바탕으로 실시간 급상승 검색어 랭킹 알고리즘을 만들어야 하는데 지금까지 구상한걸 기록해보려고 한다. 우선 실시간 급상승 검색어 기능에서 고려해야 하는 점은 아래와 같다. 평소 검색 유입량에 대비 많은 유입량을 보이는 검색어를 탐지 시간 가중치(최근에 검색된 검색어에 더 높은 점수를 적용하기 위함) 검색한 시간대에 따른 점수 보정 (새벽시간대에 검색한 검색어의 점수는 낮게 측정되게 하기 위함) 전체 검색량에 따른 점수 보정 (평소에 검색량이 많았던 키워드일 수록 점수를 낮게 측정하기 위함) 시간 가중치: 실시간 검색어 랭킹에서 최신 정보를 반영하기 위해 시간 가중치를 부여할 수 있다. 최근에 검색된 검색어에는 더 높은 가중치를 적용하여 기대 ..
[개발일지] 230607 Ranking Algorithm(순위 알고리즘)
·
성장이야기/TIL
실시간 급상승 검색어 기능을 위한 Ranking Algorithm에 대한 조사 우선 공개된 Ranking Algorithm을 살펴보면 게시글의 추천수를 기반으로 인기 게시글을 선별해 사용자에게 추천해 주는 알고리즘, 추천/비추천을 이용해 순위를 매기는 알고리즘, 평점을 기반으로 하는 순위 알고리즘 등등 여러 알고리즘이 존재한다. Hacker News Ranking Algorithm Hacker News에서 사용하는 ranking algorithm은 생각보다 간단하다. p = 게시글에 대한 추천 수 (-1을 한 이유는 글 작성자의 추천도를 고려한 것) t = 글을 게시한 시간과 현재 시간 사이의 시간(시간 단위). 예를 들어, 2시간 전에 게시된 글은 t = 2 G = 중력계수 (news.arc에서는 기본..