IRIS — AI 자연어 데이터 조회 플랫폼
한국어 자연어로 데이터베이스를 조회하는 온톨로지 기반 AI 엔터프라이즈 솔루션

프로젝트 소개
비전문가도 한국어 대화로 복잡한 데이터베이스를 조회할 수 있는 AI 엔터프라이즈 플랫폼입니다. "올해 이직률이 가장 높은 부서는?" 같은 자연어 질문을 최적화된 SQL로 변환하여 분석 결과를 반환합니다.
온톨로지 기반 아키텍처를 채택하여 비즈니스 개념과 DB 스키마를 분리함으로써, 도메인 변경 없이 새로운 산업군에 2주 내 배포할 수 있습니다.
핵심 아키텍처
8단계 쿼리 파이프라인
B-1 오케스트레이터 → 요청 라우팅 및 컨텍스트 관리
B-2 인텐트 파서 → LLM 기반 질의 의도 분류
B-3 온톨로지 리졸버 → 비즈니스 개념 추출 및 테이블 매핑
B-4 SQL 생성기 → LLM 기반 최적화된 SQL 생성
B-5 SQL 검증기 → 보안 및 안전성 검사 (화이트리스트)
B-6 쿼리 실행기 → Supabase/PostgreSQL 실행
B-7 응답 포맷터 → LLM 기반 자연어 요약
B-8 쿼리 로거 → 감사 로그 + 자기학습 데이터 축적
온톨로지 엔진
YAML 기반 온톨로지로 비즈니스 개념(클래스, 속성, 별칭, 조인 경로)을 정의합니다. 쿼리 로그를 바탕으로 온톨로지를 자동 보강하는 자기강화(Self-Reinforcing) 구조를 채택합니다.
# 온톨로지 정의 예시
classes:
- name: Employee
table: employees
aliases: ["직원", "사원", "임직원"]
properties:
- name: department
column: department_id
join: departments.id
주요 기능
데이터 분석 티어
- Tier 1: 자유형 자연어 질의 (Ad-hoc)
- Tier 1.5: 구조화된 비교 분석
- Tier 2: 트렌드, 코호트 분석, 랭킹
보안 및 접근 제어
- RBAC 5단계: 역할별 데이터 접근 범위 제한
- 부서별 필터링: 권한 외 데이터 자동 차단
- PII 마스킹: 민감 정보 자동 비식별화
- SQL 화이트리스트: 허용된 패턴만 실행
셀프러닝 시스템
- 미매칭 쿼리 자동 수집 및 분석
- 골든 쿼리 라이브러리 (100개 이상 큐레이션된 쿼리)
- 사용 패턴 기반 온톨로지 자동 확장
워크플로우
- 3개 핵심 필드 Write-back 지원
- 승인 워크플로우 연동
- Microsoft Teams 통합 (계획)
기술 스택
Next.js 16 + TypeScript 5 + React 19
Tailwind CSS 4 (UI)
Supabase PostgreSQL (데이터베이스)
Claude Sonnet 4 / Opus 4.6 (LLM)
React Flow (파이프라인 시각화)
Recharts (데이터 차트)
js-yaml (온톨로지 파싱)
Vercel (배포)
로드맵
| 단계 | 내용 | 상태 | |------|------|------| | Phase A-D | 코어 파이프라인, HR 온톨로지, RBAC | ✅ 완료 | | Phase E | 멀티턴 대화, RAG, 스트리밍, 자동 온톨로지 확장 | 📋 설계 완료 | | Phase F | 멀티에이전트, IRIS Workshop (로우코드), 외부 연동 | 🔮 계획 | | Phase G | 멀티도메인 플랫폼, 도메인 마켓플레이스 | 🔮 비전 |
설계 철학
Palantir Gotham에서 영감을 받은 온톨로지 우선 아키텍처를 채택합니다. DB 스키마가 아닌 비즈니스 개념이 SQL 생성을 주도하며, 도메인 전문가가 비용 없이 시스템을 확장할 수 있습니다.
새 도메인 도입 시 "DB 분석 → YAML 온톨로지 작성 → 배포"까지 4주 내 완료를 목표로 합니다.
프로젝트 정보
2025년 5월 1일
5 min read