최근 사포칼립스 등 SaaS(Software As a Service) 기업이 사행되고 있다는 얘기가 많이 들려옵니다.
그래서 SaaS 3대 기업이 AI 시대에 대응하기 위해 체질개선을 하고 있다고 하는데요,
그 중 우리가 잘 알고 있는 MS도 속해 있었습니다.
MS의 체질개선 관련해서는 아래와 같은 내용을 찾아볼 수 있었어요.
https://learn.microsoft.com/en-us/graph/overview
Microsoft Graph overview - Microsoft Graph
Use Microsoft Graph to derive insights and analytics from Microsoft 365 and Microsoft Entra data, and build unique, intelligent apps.
learn.microsoft.com
Microsoft Graph...? 저는 처음 봤을 때 그래프 DB를 떠올렸습니다.
위 문서를 따라가며 정리해 보니, 제가 느낀 혼동은 아래 두 가지에서 발생했습니다.
Graph라는 이름이 주는 착시, 그리고 Copilot의 리트리벌 방식이 일반적인 “벡터DB 기반 RAG”와 비슷하면서도 다른 지점이 있다는 점입니다.
이 글은 그 차이를 문서 기준으로 정리합니다.
저와 같이 그래프라는 단어에 꽂히신 분들께 이 글이 도움이 되기를 바랍니다. : )
결론부터 말하자면 Microsoft Graph는 RAG도, 그래프DB도 아닙니다
Microsoft Graph는 Microsoft 365 안의 리소스(메일, 일정, Teams, 파일, 사용자/그룹 등)에 접근하기 위한 통합 API입니다.
저장 엔진(그래프 DBMS)을 제공하는 것이 아니라, Microsoft 365 리소스를 다루는 REST API에 가깝습니다.
Graph라는 이름 때문에 저는 “관계 데이터=그래프=그래프DB” 라고 연상을 했었는데요!! 역할이 다르다고 합니다.
Graph 자체가 RAG는 아닙니다만 Copilot이 조직 데이터를 검색해서 답변의 근거로 사용하는 흐름이 있고, 그 과정에서 Graph와 인덱싱이 함께 언급됩니다.
Microsoft는 Copilot이 조직 데이터를 lexical(키워드) + semantic(의미) 인덱스로 매핑해 검색 품질을 올린다고 설명합니다.
이 설명 때문에 검색 후 근거로 답변하는 RAG의 감각과 겹쳐 보이기 쉽습니다. @_@
Graph가 RAG인 것이 아니라, Copilot의 리트리벌 흐름에서 Graph와 인덱스가 함께 쓰이는 구조라고 이해하시면 됩니다.
https://learn.microsoft.com/en-us/microsoftsearch/semantic-index-for-copilot
Semantic indexing for Microsoft 365 Copilot
Learn about semantic indexing for Microsoft 365 Copilot.
learn.microsoft.com
Copilot의 Top-K 리트리벌은 결과 단위가 다릅니다
Top-K라는 말을 들으면 보통 벡터 검색으로 K개를 뽑는다는 그림을 떠올립니다.
Copilot Retrieval API 문서를 보면, 결과 단위가 먼저 다릅니다.
Microsoft 365 Copilot Retrieval API Overview
Use the Microsoft 365 Copilot Retrieval API to ground your AI solutions with accurate, secure, and contextually relevant data from SharePoint, OneDrive, and Copilot connectors.
learn.microsoft.com
Retrieval API는 문서 목록을 반환하기보다는, 관련 텍스트 발췌(text extracts 또는 text chunks)를 반환한다고 명시합니다.
즉, 답변에 바로 넣기 좋은 텍스트 조각을 가져오는 API입니다.
이 문장을 읽고 나서 문서 검색 API라기보다 답변 재료를 수집하는 API에 가깝다는 판단이 섰습니다.
Top-K의 K는 maximumNumberOfResults로 조절하며 최대 25입니다.
Retrieval API에서 결과 개수는 maximumNumberOfResults로 제어합니다.
일반적으로 말하는 Top-K의 K가 이 파라미터로 연결된다고 이해하사면 됩니다.
relevanceScore는 코사인 유사도 기반이라고 설명되어 있습니다
Retrieval API 응답에는 relevanceScore가 포함될 수 있습니다.
문서에서는 queryString과 extract 사이의 cosine similarity를 0~1 범위로 정규화한 값이라고 설명합니다.
또한 Copilot 커넥터에서 가져온 결과는 relevanceScore가 없을 수도 있다고 명시합니다.
내부 구현을 전부 공개한 것은 아니지만, “의미 기반 유사도 점수” 축이 있다는 근거로는 충분합니다.
Retrieval API는 정렬보다 컨텍스트 확보에 무게를 둡니다
문서에서 보면 결과가 정렬되어 반환된다고 보장하지 않을 수 있다고 하네요??
대신 Context Recall 최적화라는 표현을 씁니다.
전통적인 검색 API처럼 1등부터 정렬된 결과를 기대하기보다는, 답변에 사용할 컨텍스트를 충분히 확보하는 설계로 이해하는 편이 자연스럽습니다.
이 문장 때문에 Top-K를 깔끔한 랭킹으로 이해하면 오해가 생길 수 있다는 생각도 들었습니다.
동일한 단어를 쓰다보니 여기서도 제가 혼동이 왔습니다.ㅠ
모든 파일이 semantic 또는 hybrid로 처리되는 것은 아닙니다
Retrieval API 문서에는 파일 확장자 제한이 명시되어 있습니다.
SharePoint/OneDrive에서 semantic retrieval과 hybrid retrieval이 지원되는 확장자(.doc, .docx, .pptx, .pdf, .aspx, .one)가 따로 있고, 그 외 확장자는 lexical retrieval만 지원한다고 설명합니다.
Copilot 리트리벌을 무조건 벡터 검색이라고 단정하기 어렵다는 근거입니다.
실무에서 “왜 어떤 파일은 결과가 다르지” 같은 질문이 나오면 여기부터 확인하는 편이 빠릅니다.
Search API와 Retrieval API는 목적이 다릅니다
Copilot Search API(Preview)는 Retrieval API와 성격이 다릅니다.
Search API는 OneDrive 콘텐츠를 대상으로 hybrid search(semantic + lexical)를 수행해 문서 또는 파일 중심 결과를 반환하는 쪽입니다.
문서에서 결과가 관련도 기준으로 정렬된다고 설명하고, pageSize 최대값은 100입니다.
Search API는 Preview이므로 동작과 파라미터는 변경될 수 있습니다.
문서를 찾는 목적이라면 Search API가 자연스럽고, 답변에 넣을 텍스트 발췌가 목적이라면 Retrieval API가 직접적입니다.
Microsoft 365 Copilot Search API Overview (Preview)
Use the Microsoft 365 Copilot Search API to perform hybrid search (semantic and lexical) across OneDrive for work or school content using natural language queries with contextual understanding and intelligent results.
learn.microsoft.com
제가 정리한 부분은 여기까지입니다.
한번 더 정리하면, Microsoft Graph는 Microsoft 365 리소스를 다루는 통합 API입니다.
Copilot에서 RAG처럼 보이는 이유는 semantic/lexical 인덱스와 Retrieval/Search API가 결합되어 있기 때문입니다.
두 API에 대한 설명 페이지도 링크 첨부드렸으니 자세히 알고 싶은 분들께 도움이 될 거라 생각합니다...!
여기에 추가로, 리트리벌이 결국 I/O를 타기 때문에 메모리 반도체 계층(HBF 등)까지 생각이 이어졌습니다.
그치만 이 분야는 제가 정리하더라도 틀린 부분이 있을 수 있어서 개인적으로 공부만 해야겠습니다.
틀린 부분이 있다면 댓글 부탁드립니다.
오늘도 읽어주셔서 감사합니다. :)
'AI > Trend' 카테고리의 다른 글
| 구글 새 TPU 8세대 공개: 학습과 추론을 더 분명하게 나누는 흐름 (0) | 2026.04.25 |
|---|---|
| 오픈클로(OpenClaw) 정체와 논란 정리 (0) | 2026.04.13 |
| NVIDIA에서 적용한 LPU란 무엇인가? GPU 시대 이후 Vera Rubin으로 AI 인프라 구조 변화 정리 (1) | 2026.04.03 |
| Moltbook (몰트북): AI 에이전트들을 위한 SNS라니! (ft. META) (0) | 2026.03.31 |
| GTC 2026 NVIDIA Vera Rubin 플랫폼이란? 베라 루빈 구조 분석과 LPU 역할 정리 (0) | 2026.03.20 |
댓글