아티클 제목, 내용

Deskroom 홈페이지

조직 데이터를 이해하는 LLM의 시작점: 온톨로지(Ontology)

Platform

2025. 9. 17.

공유하기

deskroom-ontology-for-ai-driven-decision-making

블로그를 구독하고 최신 글을 받아보세요.

시리즈 1편. 해석되지 않은 데이터는 아무 것도 아니다.

지난 글에서 LLM이 조직의 데이터를 정확히 이해할 수 있도록 ‘기준’을 잡아주는 역할을 하는 것이 온톨로지(Ontology)라고 언급했습니다.

의사결정을 내리기 위해 다양한 시스템의 데이터를 동시에 확인보고, 데이터 유형과 형식을 통합해서 해석이 필요합니다. 이때 단순히 데이터가 저장되어 있는 것만으로는 아무것도 할 수 없습니다. 데스크룸은 이 문제를 해결하기 위해 데이터 해석의 기준점이 되는 온톨로지, 즉 법전을 만듭니다.

데스크룸의 온톨로지를 구성하는 요소들

데스크룸의 온톨로지가 담는 것은 단순 ‘데이터’가 아니라, 그 데이터가 어디서 왔고, 어떤 객체이며, 어떤 속성을 가지고 있고, 어떤 관계를 기반으로 하고, 어떤 지표로 해석되어야 하는가입니다.

이렇게 다양한 요소들이 포함되어야만 온톨로지는 비로소 조직 데이터 구조의 뼈대가 되고, 인간이 데이터를 통해 의사결정을 할 수 있게 만드는 해석의 프레임이 됩니다.

아래에서 데스크룸의 온톨로지를 구성하는 다섯 가지 요소를 소개합니다.

1. Source: 데이터의 ‘출처’

조직이 사용하는 모든 데이터에는 출처가 존재합니다.

예를 들어, 커머스 기업이라면 주문 데이터가 자사몰에서 발생할 수도 있고, 쿠팡이나 11번가 같은 외부몰에서 발생할 수도 있습니다.

반도체 기업의 경우, 장비 장애 로그는 장비 내 센서에서 직접 들어올 수도 있고, 작업자가 수기로 기록한 프로그램에서 들어올 수도 있습니다.

데이터가 여러 경로로 유입되고, 다른 시스템을 거치며 가공되는 환경에서는 출처가 확실해야 데이터를 신뢰할 수 있습니다.

그래서 데스크룸은 각각의 데이터가 어디서 생성되었고, 어디로 흘러가는지를 명시적으로 정의합니다.

2. Object: 데이터를 구성하는 ‘객체’

객체는 조직이 다루는 데이터의 가장 기본적인 단위입니다.

예를 들어, 커머스 기업에서는 주문, 상품, 고객, 문의가 될 수 있고, 건설 기업이라면 프로젝트, 공정, 장비, 작업 지시 등이 객체에 해당합니다.

각 객체는 독립된 분석 단위이자, 다른 객체와의 관계 속에서 의미를 갖는 하나의 실체이나 개념입니다. 위에서 언급한 ‘주문’ 객체의 경우 실제로 이뤄진 한 건의 주문에 관한 모든 데이터를 포함합니다.

데스크룸은 각각의 객체를 정의함으로써, “이 주문은 어떤 고객의 것이며, 어떤 프로젝트에 속하고, 어떤 채널로 들어왔는가?”와 같이 데이터의 맥락을 추적할 수 있는 가장 기본적인 틀을 제공합니다.

3. Property: 객체를 설명하는 ‘속성’

모든 객체는 속성을 갖습니다.

예를 들어, 주문이라는 객체에는 주문 일시, 주문 채널, 고객 ID, 총금액 등의 속성이 포함됩니다.

공정이라는 객체에는 시작 시각, 담당자, 장비 ID, 공정 코드 등이 포함될 수 있습니다.

이 속성들은 AI가 데이터를 해석하기 위한 최소 단위이며, 비정형 데이터를 정형화할 때 가장 먼저 정의되어야 하는 정보 집합입니다.

데스크룸은 구조화되지 않은 주문, 공정 데이터를 AI가 분석 가능한 형태로 정제할 때, 속성 수준에서 데이터를 추출하고, 정의합니다.

4. Relation: 객체들 간의 ‘관계’

조직에서 활용하는 데이터는 고립된 단위로 존재하지 않고 다양한 관계를 맺습니다.

예를 들어, 음식점에서 배달 음식을 받은 고객에게서 ‘불만 의견’이라는 하나의 객체가 발생했다면, 이 객체는 특정한 주문 ID 속성 값을 가질 것이고, 해당 주문이 어떤 서비스에서 유입되었는지 출처를 가질 것입니다. 이때 객체 간의 관계가 명확히 정의되고 파악할 수 있어야 데이터의 흐름과 상호작용을 따라갈 수 있습니다.

데스크룸은 관계를 통해 조직 내 다양한 데이터 단위를 유기적으로 연결하고, 각 객체가 어떻게 서로 영향을 주고받는지를 분석 가능한 형태로 구조화합니다. 이는 단순한 데이터 조회를 넘어, 인과 구조 기반의 판단을 가능하게 만듭니다.

5. Metric: 객체들 간의 관계를 연산해 도출되는 ‘지표’

지표는 객체들 간의 관계를 고려하고, 연결된 객체들의 속성을 연산해 만든 값입니다.

예를 들어, ‘평균 주문 금액’은 존재하는 모든 주문 객체의 금액 속성에 평균 연산을 적용한 값입니다.

‘장비당 일일 가동 시간’은 장비 객체의 가동 시간 속성을 날짜 단위로 집계한 값입니다.

데스크룸은 이 지표를 기준으로 모든 차트, 알림, 분석 보고서를 생성합니다. 지표는 온톨로지가 다루는 데이터의 가장 마지막 층위이자, 인간의 의사결정과 가장 밀접한 접점입니다.

왜 온톨로지를 만드는 것이 중요한가?

대부분의 LLM은 데이터를 읽을 수는 있지만, 그 데이터가 조직 내에서 어떤 기준으로 해석되어야 하는지는 모릅니다. 단어는 이해하지만, 문맥은 알 수 없고. 수치를 생성할 수는 있지만, 의미를 판단하지는 못합니다.

이는 LLM의 근본적 한계에서 비롯됩니다. LLM은 대규모 데이터의 통계적 패턴을 학습한 모델로서 어떤 단어가 어떤 문맥에서 많이 등장했는지를 기억할 뿐, 그것이 우리 조직에서 어떤 규칙과 기준에 따라 해석되는지는 모릅니다. 데스크룸의 온톨로지는 이 간극을 메우는 도구입니다.

첫째, LLM이 규정된 기준에 맞춰 데이터를 해석할 수 있도록 도와줍니다.

예를 들어 ‘고객 불만’이라는 단어는 범용 LLM에게는 그저 부정적인 표현일 뿐이지만, 우리 조직에서는 ‘배송 지연’, ‘상품 이상’, ‘응대 불만’처럼 세부 속성으로 분류됩니다.

온톨로지는 각 용어가 어떤 출처(Source)에서 유입되고, 어떤 객체(Object)에 속하며, 어떤 속성(Property)을 기반으로 어떤 관계(Relation)를 고려해 어떤 지표(Metric)로 변환되는지를 정의함으로써, AI가 조직 고유의 해석 기준에 따라 정확하게 판단할 수 있도록 만듭니다.

둘째, 해석된 결과의 정합성을 검증 가능하게 만듭니다.

AI가 생성한 응답이 조직의 기준에 부합하는지, 수치가 올바른 데이터 출처와 연산 과정을 따랐는지 확인하려면 데이터가 어떤 경로를 따라왔고, 어떤 규칙에 따라 가공되었는지를 추적할 수 있어야 합니다.

온톨로지는 이 흐름을 명시적으로 정의함으로써 AI가 ‘왜 그렇게 답했는가’를 사람이 이해하고 검증할 수 있는 구조를 제공합니다.

해석의 문제를 해결하는 데스크룸 온톨로지

데스크룸은 온톨로지를 단순한 데이터 정의 도구가 아닌, AI가 신뢰 가능한 판단을 내리도록 만드는 해석의 뼈대로 설계합니다. AI가 데이터를 '이해'하는 것이 아니라, 우리가 해석하는 방식 그대로 데이터를 재구성할 수 있도록 만드는 것, 그것이 데스크룸 온톨로지의 역할입니다.

온톨로지는 기술의 문제가 아닌 해석의 문제를 해결합니다. 그리고 해석이 정교해질 때, AI는 비로소 ‘조직을 이해하는 도구’가 됩니다.

축적된 데이터는 많지만 의미를 찾기 어려웠던 문제, AI는 있으나 판단을 신뢰하지 못했던 문제는 데이터 해석의 기준이 필요하기 때문에 발생하는 문제고, 데스크룸은 그 기준을 온톨로지라는 도구로 풀어냅니다.

Next. 데스크룸이 기업을 이해하는 LLM을 만드는 방법

이어지는 글에서 데스크룸이 Prompt Engineering이라는 기법을 통해 기업을 이해하는 LLM을 만드는 실질적인 방법에 대해서 다루어보겠습니다.

고민이 있으시다면

우리 조직의 데이터를 어떻게 정의해야 하는지, AI가 우리 데이터를 제대로 이해하게 하려면 어떻게 해야할 지 궁금하시다면, 이 링크에서 데스크룸에 문의해주세요.

Diagram showing the relationship between data governance and ontology - how ontology encompasses governance as a subset

Platform

2025. 12. 8.

온톨로지와 데이터 거버넌스, 무엇이 다른가?

기업의 데이터는 분석을 위해 쌓여있지 않습니다

deskroom-supports-both-on-premise-and-cloud

Platform

2025. 11. 17.

기업에 최적화된 데스크룸 제공 방식

클라우드에서 온프레미스까지, 기업 환경에 알맞은 AI 활용

조직 데이터를 이해하는 LLM의 시작점: 온톨로지(Ontology)

Platform

2025. 9. 17.

공유하기

블로그를 구독하고 최신 글을 받아보세요.

시리즈 1편. 해석되지 않은 데이터는 아무 것도 아니다.

지난 글에서 LLM이 조직의 데이터를 정확히 이해할 수 있도록 ‘기준’을 잡아주는 역할을 하는 것이 온톨로지(Ontology)라고 언급했습니다.

의사결정을 내리기 위해 다양한 시스템의 데이터를 동시에 확인보고, 데이터 유형과 형식을 통합해서 해석이 필요합니다. 이때 단순히 데이터가 저장되어 있는 것만으로는 아무것도 할 수 없습니다. 데스크룸은 이 문제를 해결하기 위해 데이터 해석의 기준점이 되는 온톨로지, 즉 법전을 만듭니다.