본문 바로가기
반응형

IT/AI

파인튜닝 하면 내 데이터가 모델에 흡수 된다 민감정보로 LLM 파인튜닝하면 안 되는 이유— 기업 데이터 보호 관점에서의 아키텍처 선택온프레미스 AI를 구축할 때 가장 많이 받는 질문 중 하나는 이것이다.“우리 데이터를 넣어서 파인튜닝하면 더 똑똑해지는 것 아닌가요?”기술적으로는 맞는 말이다.하지만 기업 내부 데이터, 특히 민감정보가 포함된 데이터라면 이야기가 완전히 달라진다.결론부터 말하면 다음과 같다.민감정보 기반 파인튜닝은 성능 문제가 아니라데이터 거버넌스 / 보안 / 운영 / 법적 리스크 문제다.1. 파인튜닝이 위험해지는 순간 — 데이터가 모델 안으로 들어간다RAG 구조에서는 데이터의 위치가 명확하다.데이터 → 데이터베이스에 존재모델 → 필요할 때 조회만 수행하지만 파인튜닝은 다르다.데이터 → 모델의 가중치에 흡수됨이 말의 의미는 단순하다.어.. 2026. 2. 20.
데이터 유출 없이 AI 사용하는 방법 우리 회사 데이터를 외부로 보내지 않는 AI— 로컬 LLM 온프레미스 구축 전략과 아키텍처AI를 도입하려는 기업이 가장 먼저 마주하는 질문은 성능이 아니라 이것이다.“우리 데이터가 밖으로 나가지 않는가?”“이 데이터가 모델 학습에 쓰이지 않는가?” 이 글은클라우드 API 기반이 아닌온프레미스(로컬) LLM 인프라를 직접 구축하는 방법과데이터 유출 없이 사용하는 아키텍처 설계 원칙을 정리한 실무 가이드다. 1. 왜 온프레미스(로컬) AI가 필요한가일반적인 구조:사내 데이터 → OpenAI / Anthropic / Google API → 결과 반환 이 구조의 리스크:데이터 외부 전송로그 저장 가능성규제 / 컴플라이언스 이슈지속적인 API 비용온프레미스 구조:사내 데이터 → 사내 LLM → 결과 반환 핵심 차.. 2026. 2. 20.
무료로 AI 이미지 생성 하는 방법 - DALL·E 3 (달리3) 무료로 AI 이미지 생성 하는 방법 - DALL·E 3 (달리3) 1. 사이트 사용방법 / 소개 2. 따라해보기 3. 퀄리티 높은 이미지 만드는 방법 달리3는 챗GPT4 유료 버전에서 사용 가능하지만, 달리3를 무료로 사용할 수 있도록 개발한 사이트는 무료입니다. 무슨말이냐구요? ㅎㅎ 마이크로소프트 bing 에서 달리3를 무료로 사용할 수 있도록 bing 사이트에 구현해 놓았습니다. 마이크로소프트 아이디만 있으면 사용할 수 있습니다. 아래 링크는 마이크로소프트가 제공하는 AI 이미지 생성 사이트 입니다. https://www.bing.com/images/create?FORM=GENILP 사이트 사용 방법 / 소개 가입 및 만들기 버튼을 눌러서, 아이디가 없으시다면 가입 후 로그인 하시고, 마이크로 소프트.. 2024. 3. 27.
챗GPT 에게 머신러닝 분석 시키는 방법 - 이렇게 질문하세요 챗GPT 에게 머신러닝 분석 시키는 방법 - 이렇게 질문하세요 파이썬 할 줄 몰라도 머신러닝을 할 수 있는 시대가 됐습니다. 바로 챗 GPT 를 통해서요! 저는 머신러닝을 통해, 이 제품을 최소 얼마 이상으로는 팔아야 손해보지 않는지, BEP 값을 예측하고 싶었습니다 그래서 GPT 에게 이렇게 질문했습니다. 참고로 저는 무료버전 GPT 를 쓰고 있습니다. 제가 GPT 와 대화한 내용을 공유합니다. 보시고, 원하는 내용으로 변경해서 질문하시면 됩니다 :) ↓ 챗 gpt와 대화내용 일부 ↓ 챗gpt 와 대화 내용 전문 나 ) 현재 온라인 쇼핑몰을 운영하고있어. 제품마다 얼마 이상으로는 판매해야 손해가 나지 않는지 적정 판매금액을 알고싶어. 제품 무게에 따라 배송비가 달라서 제품 무게별 배송비 데이터는 가지고.. 2024. 2. 21.
728x90
반응형