네이버 블로그를 키우면서 AI 검색 원리를 이해하게 됐습니다

네이버 블로그를 처음 시작했을 때 제목에 키워드를 쑤셔 넣는 방식이 직관적으로 맞지 않는다는 느낌이 있었습니다. 왜인지는 몰랐는데, 그냥 그렇게 쓴 글들이 실제로 읽히지 않았고 그렇게 쓰지 않은 글들이 잘 됐습니다. 그래서 처음부터 사람이 실제로 궁금해할 것 같은 문장을 기준으로 글을 썼는데, 이게 나중에 보니까 이유가 있는 방식이었습니다.

노출 경로가 점점 구체화되는 걸 느꼈습니다

블로그를 운영하다 보면 어느 시점부터 내 글이 어떤 경로로 읽히는지가 보이기 시작합니다. 처음에는 그냥 검색에서 들어오는구나 정도였는데, 시간이 지나면서 어떤 검색어로 들어오는지, 어떤 글이 꾸준히 유입을 만드는지, 어떤 글은 올린 날만 읽히고 끝나는지가 패턴으로 잡혔습니다.

꾸준히 읽히는 글들의 공통점이 있었는데, 키워드가 많이 들어간 글이 아니라 하나의 질문에 끝까지 답한 글들이었습니다. 제목도 마찬가지였습니다. “청년지원금 신청방법”처럼 키워드 나열형 제목보다 “청년지원금 신청 전에 탈락하는 이유가 따로 있습니다”처럼 사람이 실제로 고민하는 지점을 건드린 제목이 클릭도 많이 나오고 오래 살아남았습니다.

그러면서 네이버 로직이 바뀌고 있다는 걸 체감하기 시작했습니다.

키워드가 아니라 의미를 읽는다는 걸 알게 됐습니다

AI 검색이 어떻게 작동하는지를 공부하다가 이 감각에 이유가 붙었습니다. 요즘 검색 엔진은 입력한 문장을 키워드로 쪼개지 않고 문장 전체의 의미를 벡터라는 숫자 덩어리로 변환합니다. 그리고 콘텐츠도 똑같이 벡터로 변환해서, 사용자가 입력한 벡터와 가장 가까운 위치에 있는 콘텐츠를 찾아 올립니다.

“서울 날씨”와 “오늘 서울 기온”은 키워드가 다르지만 이 벡터 공간에서는 서로 매우 가깝습니다. 반대로 “청년지원금 신청방법”이라는 키워드를 제목에 세 번 박아넣은 글이, 실제로 청년지원금 탈락 사유와 극복 방법을 구체적으로 다룬 글보다 검색 의도에서 멀 수 있습니다.

그게 제가 직관적으로 느끼던 것의 이유였습니다. 키워드 밀도가 아니라 사용자의 의도에 얼마나 가까이 위치하느냐가 노출을 결정한다는 구조였습니다.

RAG라는 개념이 설명해주는 것

퍼플렉시티나 ChatGPT 검색처럼 직접 답변을 생성하는 AI 서비스들은 RAG(Retrieval-Augmented Generation)라는 구조로 작동합니다. 검색으로 관련 콘텐츠를 몇 개 끌어온 다음 그걸 참고해서 새 답변을 만드는 방식인데, 이 과정에서 인용되는 콘텐츠에는 조건이 있습니다.

유사도 점수가 높은 것만으로는 부족하고, 사용자의 질문을 글 한 편으로 완전히 해소하는지, 실제 경험과 신뢰 신호가 있는지까지 같이 봅니다. 제가 오래 살아남는다고 느꼈던 글들이 바로 이 조건을 자연스럽게 충족하고 있었습니다. 하나의 질문에 끝까지 답하고, 실제로 경험한 내용으로 씌어 있었으니까요.

처음부터 그렇게 썼는데 나중에서야 왜인지를 알았습니다

이걸 공부하고 나서 돌아보니 재밌는 부분이 있었습니다. 저는 이 구조를 이해해서 그렇게 쓴 게 아니라 그냥 그렇게 쓰는 게 맞는 것 같아서 썼는데, 원리가 그걸 설명해주고 있었습니다.

반대로, 이 구조를 몰랐던 시기에 잘못 접근했던 방식도 설명이 됐습니다. 같은 키워드를 제목과 본문에 반복하거나, 길이를 억지로 늘리거나, 관련 없는 내용을 끼워 넣었던 시도들이 왜 효과가 없었는지가 벡터 공간에서 그 글의 위치를 생각해보면 이해가 됐습니다. 의도 벡터에서 멀어지는 방향으로 글을 수정하고 있었던 겁니다.

네이버 로직이 바뀌는 걸 느낀다는 감각은 사실 AI 검색이 성숙해지는 방향과 일치합니다. 키워드 매칭에서 의미 매칭으로, 그리고 그 의미를 얼마나 완전하게 다루는지로 기준이 계속 이동하고 있으니까요. 직관이 먼저 이걸 감지했고, 이제는 그 이유를 알게 됐습니다.

노출 경로가 점점 구체화되는 걸 느꼈습니다

키워드가 아니라 의미를 읽는다는 걸 알게 됐습니다

RAG라는 개념이 설명해주는 것

처음부터 그렇게 썼는데 나중에서야 왜인지를 알았습니다

❯ comments (2)