본문 바로가기
📊

Data 348개 용어

ML·데이터 파이프라인·ETL·Warehouse·MLOps·분석 엔진

Polaris Catalog👁 51
Snowflake가 Apache Foundation에 기증한 Iceberg REST 카탈로그.
QuestDB👁 51
SQL·시계열 특화 고성능 DB. 금융·IoT.
Star Schema👁 51
Warehouse의 고전적 설계. 중앙 팩트 테이블 + 여러 디멘션 테이블.
Windowing👁 51
무한 스트림을 유한 창으로 분할. Tumbling·Sliding·Session.
dbt Mesh👁 50
여러 dbt 프로젝트를 조직 단위로 연결. 데이터 메시 구현.
Iceberg Partition Evolution👁 50
Iceberg의 파티션 스키마 변경 안전성. 과거 데이터 재처리 불필요.
Kafka Partition👁 50
Kafka 토픽의 분산 단위. 병렬 처리·순서 보장·확장성의 기본.
MLflow Tracking·Registry👁 50
실험 추적·모델 버전 관리. Databricks 오픈 표준.
Pulsar Functions👁 50
Pulsar 내장 스트림 처리. 메시지→함수→토픽.
Qdrant👁 50
Rust 기반 오픈소스 벡터 DB. Payload filter 강점.
Real-time OLAP👁 50
Druid·Pinot·ClickHouse. 실시간 집계·이벤트 분석.
Soda👁 50
SQL 기반 데이터 품질 검사 도구. SodaCL DSL로 선언적 체크.
SQLGlot👁 50
Python SQL 파서·변환기. 방언 간 쿼리 변환.
StarRocks👁 50
MPP 분석 DB. Apache Doris 포크. Iceberg 네이티브.
Unity Catalog👁 50
Databricks의 데이터 거버넌스 계층. 2024년 OSS.
Unity Catalog Lineage👁 50
테이블·컬럼 수준 데이터 계보 자동 추적.
Weaviate👁 50
모듈형 OSS 벡터 DB. Hybrid 검색·임베딩 자동 생성.
Windmill👁 50
오픈소스 개발자 플랫폼. 스크립트·워크플로·UI 통합.
Analytics API👁 49
제품에 분석 API 임베드. GoodData·Cube·Hightouch Events.
ClickHouse Cloud👁 49
ClickHouse의 매니지드 서비스. 서버리스 분석.
ClickHouse MV👁 49
ClickHouse의 실시간 사전 집계. INSERT 시 자동 갱신.
Customer 360 / CDP Profile👁 49
고객을 중심으로 행동·거래·서포트를 통합한 레코드.
dbt Seeds👁 49
CSV 파일을 Warehouse 테이블로 로드. 기준 데이터용.
dbt Snapshot👁 49
SCD Type 2 자동 구현. 변경 이력 자동 추적.
dbt Test👁 49
스키마 테스트·커스텀 SQL 테스트. 데이터 품질 게이트.
Kafka Consumer Group👁 49
같은 그룹 내 컨슈머가 파티션을 나눠 병렬 소비.
Kubeflow Trainer👁 49
K8s 분산 ML 훈련. PyTorch·TF·XGBoost 오퍼레이터.
Snowflake Openflow👁 49
Apache NiFi 기반 Snowflake 공식 인제스트.
Apache DataFusion👁 48
Rust 기반 임베디드 SQL 쿼리 엔진. Arrow·Iceberg 네이티브.
Arrow Flight👁 48
Arrow 기반 고성능 데이터 전송 프로토콜. ODBC/JDBC 대체.
BigQuery ML👁 48
BigQuery에서 SQL로 ML 모델 학습·추론.
Bufstream👁 48
Buf의 Kafka 호환 + 스키마 거버넌스. Protobuf 기반.
Data Fabric👁 48
메타데이터·AI 기반 통합 데이터 아키텍처. Data Mesh 대안.
Deep Learning👁 48
DL
다층 신경망을 사용하는 ML의 하위 분야. 이미지·음성·NLP에 혁명적 성능.
Delta Sharing👁 48
회사 간 데이터를 복사 없이 공유하는 오픈 프로토콜.
Feature Store Online/Offline👁 48
훈련·추론 간 피처 일관성을 위한 dual store.
Hightouch👁 48
Warehouse → SaaS 동기화 Reverse ETL 선두. Data Activation.
LlamaIndex for Data👁 48
LlamaIndex의 구조화 데이터 지원. SQL·Pandas·NL Query.
Log Compaction👁 48
같은 키의 오래된 메시지를 제거해 최신 값만 유지.
MongoDB Atlas👁 48
MongoDB 매니지드 클라우드. 자동 샤딩·백업·검색·벡터.
Snowflake Copilot👁 48
Snowflake의 AI 어시스턴트. Cortex 기반 자연어 SQL.
ByteHouse👁 47
ByteDance의 ClickHouse 포크 상용화.
Dagster Software-Defined Assets👁 47
Dagster의 자산 중심 오케스트레이션. 데이터 객체가 1급.
Feast (Feature Store)👁 47
오픈소스 Feature Store. Online·Offline·Streaming feature.
pgvector 튜닝👁 47
IVFFlat·HNSW 선택. lists·ef_search.
Ray Serve👁 47
Ray 기반 모델 서빙. 복잡 pipeline·multi-model.
BigQuery + Gemini👁 46
BigQuery의 Gemini AI 통합. 자연어 쿼리·데이터 준비 자동화.
Flink State👁 45
Flink 스트림의 상태 관리. KeyedState·OperatorState·Checkpointing.