전체 글14 허깅페이스에서 오픈소스 모델로 양자화기법을 적용하여 요약 모델 구현하기 안녕하세요 오니입니다🐰Transformers 라이브러리는 자연어 처리를 위한 많은 태스크를 지원 및 직접 정의한 헤더를 부착하여 원하는 태스크를 수행할 수 있는 확장성을 가지고 있어 굉장히 유용한 라이브러리인데요. 요즘은 gpt API를 활용하여 여러 업무에 활용하고 있지만, 단순히 LLM실습을 해보거나 때로는 오픈소스 모델을 시도/활용해야하는 상황도 분명 존재합니다. (실제로 회사에서 답변을 요약하는 과제를 수행했을 때 오픈소스 모델로 먼저 테스트를 해봤습니다. 하지만 실제 업무에 활용하기에는 데이터양으로 인한 속도 이슈로 인해 GPT4o-mini를 사용했답니다😝 그럼에도 분명 의미가 있는 과정이었어요👍) 따라서 이번 포스팅에서는 허깅페이스에서 오픈소스 모델인 'Ko-Qwen2-7B-Instruc.. 2025. 2. 1. 평균값을 구하는 다양한 방법:이동평균, 누적평균, 가중이동평균, 지수이동평균 안녕하세요 오니입니다🐰 편의점 주문량 수요예측을 하는 과제를 진행하면서, 변화가 빠른 편의점 채널 특성상 트렌드가 변하는 주기가 짧은 상품군들이 있었습니다.이런 경우 다양하고 복잡한 알고리즘의 머신러닝, 딥러닝 기법보다는 오히려 베이직한 통계기반이 더 적절할 수 있겠다는 생각이 들었는데요. 그래서 준비한 이번 포스팅에서는 평균을 구하는 여러 방법론들에 대해 정리해보겠습니다. (feat. G선생) 💡Point- 트리계열의 모델의 경우 시간에 대한 개념이 변수에 직접적으로 반영되지 않기 때문에 최신 주문량값에 더 가중치를 부여하여 학습하고 싶다면 파생변수로 활용할 수도 있습니다. 다만 data leakage를 주의해야합니다. 미래 데이터가 사용되지 않도록, 학습-검증 데이터셋으로 나눌 경우 계산을 별도로.. 2025. 1. 22. 트랜스포머 구조는 어떻게 GPT 구조의 기반이 되었을까?:RNN부터 트랜스포머까지 안녕하세요 오니입니다.요즘은 무엇이든 막히거나 모를 때 GPT에게 물어보는 것이 일상이 되었는데요. 오랜만에 이론으로 다시 돌아가 딥러닝을 배울 때 등장하는 RNN에서부터 GPT의 구조의 기반이 되는 트랜스포머구조까지의 발전 흐름에 대해 직관적인 이해를 해보도록 하겠습니다.*이번 포스팅에서는 딥러닝 이해에 도움을 주었던 혁펜하임님의 '혁펜하임의 Easy! 딥러닝' 책에서 흥미로운 부분을 인용하여 작성하였습니다. RNN특징RNN(Recurrent Neural Network)은 시간적 순서나 순차적인 관계를 가진 데이터 처리에 유용한 구조이지만 길이가 긴 경우 초기 정보의 손실 문제가 발생하고 병렬처리가 어려워 학습속도가 느리다는 한계가 있습니다. 동작방식1. 연속 데이터를 처리하기 위해 적절한 단위로 나.. 2025. 1. 19. 개인화 맛집 추천 시스템 구축기 : 첫번째 이야기 안녕하세요 오니입니다.🍀이번 포스팅에서는 현재 진행하고 있는 개인화 맛집 추천 시스템 프로젝트 소개 및 구현 과정에 대해 공유하고자 합니다.완성도 있는 글을 쓰고 싶었으나.. 수집 식당의 갯수가 10만개 이상임을 고려했을 때 포스팅 1-2개로 끝날 일이 아닌 것 같아 (임시저장글에서 오랫동안 탈출하지 못할 것 같아) 시리즈물로 작성해보려합니다. 프로젝트 소개 개인화의 정의는 사용자 개인의 취향과 상황에 따라 식당을 다르게 추천하는 것으로 정의합니다.보통 식당에 갈 때, 방문 목적/동행인과 희망 음식종류에 따라 식당을 찾고 선택한다는 점을 고려하여, 이를 고려한 맛집 추천 시스템 구축을 목적으로 합니다. 수집데이터수집데이터는 크게 식당 정보 데이터와 리뷰데이터입니다.리뷰데이터의 경우 리뷰어가 작성한 총.. 2025. 1. 5. [빵그리의 오븐 추천시스템 구축기]4.상품 메타데이터 기반 유사상품 추천 이전 이야기https://thrcle.tistory.com/8 [빵그리의 오븐 추천시스템 구축기]3.사용자 데이터 분석 기반 메인 홈화면 상품 추천이전 이야기https://thrcle.tistory.com/7 [빵그리의 오븐 추천 시스템 구축기]2.메인 홈화면 상품 추천을 위한 테스트 설계 과정안녕하세요. 오니입니다 🙌이번 포스팅에서는 메인 홈 화면에서 상품thrcle.tistory.com Intro안녕하세요! 오니입니다.앞선 포스팅에서 유저데이터 부족&콜드스타트 문제의 상황에서 추천시스템 구축을 위해 2가지 관점에서 나누었다고 언급하였는데요. 1. [메인 홈화면]사용자 분석을 통한 세그먼트별 인기상품 추천2. [상품 상세페이지] 상품 메타데이터 기반 유사상품 추천 이번 포스팅에서는 이전 포스팅에 이어.. 2024. 12. 21. [빵그리의 오븐 추천시스템 구축기]3.사용자 데이터 분석 기반 메인 홈화면 상품 추천 이전 이야기https://thrcle.tistory.com/7 [빵그리의 오븐 추천 시스템 구축기]2.메인 홈화면 상품 추천을 위한 테스트 설계 과정안녕하세요. 오니입니다 🙌이번 포스팅에서는 메인 홈 화면에서 상품 추천 구축기:유저데이터 모집 및 테스트 설계 과정에 대해 공유하고자 합니다. 테스트 목적 및 설계우선 이전 포스팅에서thrcle.tistory.com Intro추천시스템을 구현하는 관점에서 생각해보면,추천시스템이란 어떤 유저에게 어떤 상품을 어떤 순서로 정렬할 것인가의 문제입니다. 유저데이터 부족&콜드스타트 문제의 상황에서 개인화 추천시스템을 구축한다는 것은 아직 먼 이야기일 것입니다.이에 단계별 목표를 정하는 것이 중요하다고 생각되었고빵그리의 오븐 추천시스템을 2가지 관점에서 나누어 구축하.. 2024. 11. 24. 이전 1 2 3 다음