File tree 1 file changed +58
-0
lines changed
1 file changed +58
-0
lines changed Original file line number Diff line number Diff line change
1
+ ## 🗣 자연어 기반 제품 추천 시스템 - Danawa(다나와)
2
+
3
+
4
+
5
+ <p align =" center " >
6
+ <img src =" https://github.com/bik1111/danawa/assets/76617139/e71b51cf-ee16-4486-b223-9669356d1081 " alt =" Danawa GIF " >
7
+ </p >
8
+
9
+
10
+ <br >
11
+
12
+ ## 🚀 Motivation of Project
13
+ 나이가 많으신 혹은 E-commerce 상에서 상품 구매 과정에 대해 어려움을 느끼시는 분들에게 해당 과정에 대한 노고를 줄이고 직관적인 구매 경험을 제공하고자 하였습니다.
14
+
15
+ <br >
16
+
17
+ ## 🛠 Skills
18
+
19
+ #### Language
20
+ ![ Python] ( https://img.shields.io/badge/python-3670A0?style=for-the-badge&logo=python&logoColor=ffdd54 )
21
+ #### Infra
22
+ ![ AWS] ( https://img.shields.io/badge/AWS-%23FF9900.svg?style=for-the-badge&logo=amazon-aws&logoColor=white )
23
+ #### Environment (CI/CD)
24
+ ![ GitHub Actions] ( https://img.shields.io/badge/github%20actions-%232671E5.svg?style=for-the-badge&logo=githubactions&logoColor=white )
25
+
26
+ <br >
27
+
28
+
29
+ ## 🌐 Development Architrecture (Data ETL Side)
30
+ ![ zzzzz1111] ( https://github.com/bik1111/danawa/assets/76617139/de7f0d78-4778-4371-a35e-493847d8eca3 )
31
+
32
+
33
+
34
+ ## 🌐 Service Architrecture
35
+ ![ ggggggggg] ( https://github.com/bik1111/danawa/assets/76617139/d18f9491-5bf5-4e4d-81d4-965c96a5b1ff )
36
+
37
+ <br >
38
+
39
+ ## 💡 Sentence-transformers model
40
+
41
+ - https://huggingface.co/jhgan/ko-sroberta-multitask
42
+ - https://github.com/jhgan00/ko-sentence-transformers
43
+
44
+ <br >
45
+
46
+ ## ⛓ Data ETL & Response to user's query Process
47
+
48
+ 1 . ChromeDriver 및 Selenium, BeautifulSoup을 통한 네이버 쇼핑몰 내 상품의 상품명/가격/스펙/URL 크롤링
49
+ 2 . URL을 순회하며 해당 상품에 등록된 리뷰(Review) 크롤링
50
+ 3 . 수집된 데이터들을 CSV 형태로의 변환 및 저장
51
+ 4 . Sentence Transformer 모델을 사용하여 리뷰 Column Embedding 수행
52
+ 5 . Embedding 완료된 최종 데이터를 DynamoDB에 적재
53
+ 6 . 유저 요청 시, DB 스캔 후 Embedding Vector를 바탕으로 Cos-Similarity 계산
54
+ 7 . 유사도 기반 상위 K개 제품 반환
55
+
56
+
57
+
58
+
You can’t perform that action at this time.
0 commit comments