체유의 IT일지

LLM과 RAG (transformer, fine-tuning과 RAG 차이, 벡터DB) :: 면접 대비 복습

LLM (Large Language Model): 대규모 언어 모델로, 수많은 파라미터를 가진 인공 신경망으로 구성된 언어 모델. - 방대한 데이터 세트를 학습하기에 "대규모"라는 이름이 붙음- Transformer 신경망 아키텍처 기반- tuning을 통해서 추가 학습이 이루어지며 프로그래머가 원하는 특정 작업에 맞게 조정- 학습 데이터에 기반해서 답변을 생성하기 때문에 편향적 답변이나 환각 현상 발생 가능성 높음 ※ Transformer 모델- 기존 RNN, LSTM, GRU와 달리 셀프 어텐션이라는 메커니즘을 도입- 병렬 처리가 가능하며 문장의 모든 단어를 동시에 처리가 가능- 장거리 의존 문제 해결: 셀프 어텐션 메커니즘으로 문장 내 모든 단어 간의 관계를 직접 계산- 문맥을 고려해서 단어의 의..

IT Study/ML & DL 2025.01.04

데이터 리터러시를 키우기 위한 독서, <데이터 문해력>을 읽고

데이터를 활용해서 기획, 분석, 시각화 등을 하는 사람들은 물론, 데이터를 보는 사람들 모두에게 데이터 문해력이 필요하다그런 관점에서 추천받았던 데이터 문해력 책을 읽어보았다. 나는 지금까지 ‘데이터 분석 자체'를 목적으로 생각했다.그러나, 데이터 분석에만 집중하다보니 코드도 GPT가 더 잘하고 사실상 내가 하는 부분이 많이 없다는 것을 느꼈다. 데이터와 데이터 분석은 목적을 달성하기 위한 도구에 지나지 않고, 이를 어떻게 활용할 것인지가 더 중요한 것 같았다.그렇다면 나는 무엇을 해야하며 어떤 전문성을 갖추기 위해 노력해야 할까?를 고민했을 때 데이터 분석을 위한 기술을 익히는 것도 중요하지만 데이터를 이해하고 활용 및 기획하는 역량이 필요하다는 생각이 들었다. 데이터 문해력 (Data Literac..

Activity/Data 2024.11.24

💬경험을 되돌아보며 데이터 직무 커리어 고민

Q. 내가 궁극적으로 하고 싶은 것은 무엇인가 ?A. 데이터 전문가가 되는 것그렇기 위해 기획, 수집, 가공, 분석, 활용 프로세스를 모두 이해하고 다룰 수 있으며 최종적으로는 이를 관리하는 PM이 되는 것. 약 4년 전으로 back...대학교 1학년 까지 나는 아이디어 도출이 무에서 유를 창출하는 것이라고 생각했다. 그래서 스스로 창의성이나 아이디어가 부족하다고 느끼며 기획과 거리가 멀다고 생각했다. 하지만 교내외에서 다양한 프로젝트를 진행하면서 기획이 필수적이며 모든 것이 기획에서 시작된다는 것을 깨달았다. 그럼 기획은 놓칠 수 없는 부분이고 '어떻게 하면 이를 극복할 수 있을까'를 고민하게 되었다. 주변의 조언을 듣고 정보를 찾아보면서 아이디어 도출이 창의성만의 영역이 아니라는 것을 알게 되었다...

Insight 2024.10.27

[Programmers SQL] IN 쿼리에서 NULL 처리

[ SQL문제 ] IS NULL > 업그레이드 할 수 없는 아이템 구하기 https://school.programmers.co.kr/learn/courses/30/lessons/273712 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr Q.더 이상 업그레이드할 수 없는 아이템의 아이템 ID(ITEM_ID), 아이템 명(ITEM_NAME), 아이템의 희귀도(RARITY)를 출력하는 SQL 문을 작성해 주세요. 이때 결과는 아이템 ID를 기준으로 내림차순 정렬해 주세요. ITEM_INFO 테이블 ITEM_ID ITEM_NAME RARITY PRICE 0ITEM_ARARE100001ITEM_BRARE..

카테고리 없음 2024.10.24

[Programmers SQL] WITH RECURSIVE문

WITH RECURSIVE문 (재귀 쿼리)✅ WITH RECURSIVE 쿼리문을 작성하고 내부에 UNION을 통해 재귀를 구성하는 것이 포인트 Ex. n 컬럼의 값이 3보다 작은 값 찾기WITH RECURSIVE cte_count AS ( -- Non-Recursive 문장( 첫번째 루프에서만 실행됨 ) SELECT 1 AS n UNION ALL -- Recursive 문장(읽어 올 때마다 행의 위치가 기억되어 다음번 읽어 올 때 다음 행으로 이동함) SELECT n + 1 AS num FROM cte_count WHERE n 반드시 UNION을 사용해야 함반드시 Non-Recursive도 최소한 1개 요구됨 [ SQL 문제 ] SELECT > 특성 세대의 ..

IT Study/DB 2024.10.22

GenAI 공공데이터 활용 경진대회 - <산업별 미스매치 예측 및 대시보드 서비스> 정리

프로젝트 회고참가 개요같이 인턴을 했던 언니 오빠들과 공모전에 참가를 하게 되었다모두 데이터, IT 관련 전공에 웹개발, AI 관련 부트캠프도 참여했던 경험이 있고 희망 직무도 유사했다추천을 받아서 해당 공모전에 참여를 하게 되었고 약 2달간 준비했던 것 같다각자 인턴 + 대외활동을 하면서도 틈틈이 준비하고 막바지에는 여러 일들이 겹치면서 3-4시간 자면서 발표 준비를 했던 것 같다 프로젝트 진행하면서 어려웠던 점- 데이터 전처리 과정에서, 유효구직과 유효구인의 기준이 달라서 취합하는 과정에 어려움이 있었음-> 구직은 직종별이지만 구인은 산업 대분류별로 되어있음. 직종 키워드를 기반으로 산업에 매칭시킴- 데이터 기반으로 문제 정의와 우리 아이디어의 필요성, 타당성 등의 논리를 수립하는 것이 쉽지는 않았다..

Activity/Data 2024.10.13

[Programmers로 코딩테스트 준비] 큰 수 만들기 - Lv.2_Day3

일자: 2024년 08월 29-30일알고리즘: 탐욕법 문제 설명어떤 숫자에서 k개의 수를 제거했을 때 얻을 수 있는 가장 큰 숫자를 구하려 합니다. 예를 들어, 숫자 1924에서 수 두 개를 제거하면 [19, 12, 14, 92, 94, 24] 를 만들 수 있습니다. 이 중 가장 큰 숫자는 94 입니다. 문자열 형식으로 숫자 number와 제거할 수의 개수 k가 solution 함수의 매개변수로 주어집니다. number에서 k 개의 수를 제거했을 때 만들 수 있는 수 중 가장 큰 숫자를 문자열 형태로 return 하도록 solution 함수를 완성하세요.제한 조건number는 2자리 이상, 1,000,000자리 이하인 숫자입니다.k는 1 이상 number의 자릿수 미만인 자연수입니다. 접근 방법가장 큰..

IT Study/코딩테스트 by Python 2024.08.31

[Programmers로 코딩테스트 준비] 조이스틱 - Lv.2_Day2👎🏻

아직 이해 ❌일자: 2024년 08월 28,30일알고리즘: 탐욕법 문제 설명조이스틱으로 알파벳 이름을 완성하세요. 맨 처음엔 A로만 이루어져 있습니다. ex) 완성해야 하는 이름이 세 글자면 AAA, 네 글자면 AAAA 조이스틱을 각 방향으로 움직이면 아래와 같습니다. ▲ - 다음 알파벳 ▼ - 이전 알파벳 (A에서 아래쪽으로 이동하면 Z로) ◀ - 커서를 왼쪽으로 이동 (첫 번째 위치에서 왼쪽으로 이동하면 마지막 문자에 커서) ▶ - 커서를 오른쪽으로 이동 (마지막 위치에서 오른쪽으로 이동하면 첫 번째 문자에 커서) 예를 들어 아래의 방법으로 "JAZ"를 만들 수 있습니다. - 첫 번째 위치에서 조이스틱을 위로 9번 조작하여 J를 완성합니다. - 조이스틱을 왼쪽으로 1번 조작하여 커서를 마지막 문자..

IT Study/코딩테스트 by Python 2024.08.31

Programmers로 코딩테스트 준비하기 Day1

시작 전 programmers에서는 SQL 문제만 거의 다 풀어봤고, 코데는 백준으로만 준비해봤다백준은 뭔가 정이 안 가는 느낌..(?) 이라서이번엔 programmers로 코딩테스트 공부를 해보려 한다 !!약 1년 만에...? 코딩 테스트 준비..ㅎㅎㅎ SQL만 풀면 문제 풀이가 부족하다고 리포트를 안보여주는 구나...암튼 ! 본격적인 코딩 테스트 준비 전 순위는 118,125위이고하반기 목표: 5,000위 내로 진입 (사실 어느정도인지 가늠이 안돼서.. 일단 목표는 높게 !!) 일자: 2024년 08월 27일알고리즘: 탐욕법 기초 문제## 대소문자 바꾸기.swapcase() 알고리즘 고득점 Kit그리디 - 1. 체육복 문제 설명 점심시간에 도둑이 들어, 일부 학생이 체육복을 도난당했습니다. 다..

IT Study/코딩테스트 by Python 2024.08.27

[NestJS] 프로젝트 Error 및 Trouble Shooting

1 발생한 에러 ERROR [ExceptionHandler] Nest can't resolve dependencies of the CumulativeRecordRepository (?). Please make sure that the argument DataSource at index [0] is available in the TypeOrmModule context. Potential solutions: Is TypeOrmModule a valid NestJS module?If DataSource is a provider, is it part of the current TypeOrmModule?If DataSource is exported from a separate @Module, is that mod..

IT Study 2024.02.05

체유의 IT일지

전체 글 66

티스토리툴바