일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- R에서의 워드클라우드
- word2vec
- 자언어처리모델
- self-attention
- 자연어처리
- deeplearning개념
- 체험디자인
- 마르코프
- StringJoiner
- 상호작용디자인
- R dataframe
- 어탠션
- R 키워드 가중치
- deeplearning용어
- 언어모델
- RNN Attention
- 마르코프 체인
- 딥러닝개념
- r word2vec
- selfattention
- R 워드클라우드
- 도날드노만
- StringBuffer vs StringBuilder
- R에서의 wordcloud
- WordCloud R
- wordVector
- 딥러닝용어
- 통계기반자연어처리
- HashMap
- R TF-IDF
- Today
- Total
목록Python (2)
클로이의 데이터 여행기
이번 포스팅에서는 word2vec_basic.py 라이브러리에 대해 살펴보려고 합니다.참고로 word2vec_basic.py은 가장 잘 알려져 있는 word2vec 라이브러리 중 하나라고 하네요! 라이브러리를 사용하면 간단히 딥러닝을 해볼 수 있다는 이야기는 많이 들어봤지만,실제로 이렇게 간단하게 사용할 수 있을 줄은 상상도 못했습니다!(물론 정교한 튜닝을 위해서는 별도의 코딩작업이 필요하겠지만요 T_T....) 직접 라이브러리를 찾고, 알아본 과정을 간단히 적어보았습니다. 1. 라이브러리 받는 곳 word2vec_basic.py 라이브러리는 tensorflow github에 올라와있습니다.아래의 주소에서 라이브러리를 받으시면 됩니다 (: https://github.com/tensorflow/tensor..
이번에 설명할 코드는 '중복키워드를 추출하는 기능'을 수행합니다.데이터 구축 시, 중복 키워드는 늘 이슈인데 제가 사용하는 관리기에서 그 기능을 지원하지 않습니다. 데이터 업로드 전에 미리 중복 키워드를 체크하고, 관리기에 반영하기 위하여 아래의 코드를 작성하였습니다. 엑셀에서도 간단히 가능하지만! 데이터가 많아지면 엑셀이 많~~이 버벅거리기 때문입니다.다량의 비정형 텍스트를 주로 다루기 때문에 이런 코드가 필요했습니다. 간단하지만 가장 유용히 쓰고 있는 이 내용을 공유합니다^.^ 너무 간단하고 직관적이라 따로 변수 설명 등은 달지 않으려 합니다. 123456789101112131415161718192021222324252627f = open("C:/data/input/defaultCount.txt","..