일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 통계기반자연어처리
- R 키워드 가중치
- deeplearning개념
- R TF-IDF
- word2vec
- 마르코프
- wordVector
- 딥러닝개념
- 어탠션
- 딥러닝용어
- selfattention
- 언어모델
- deeplearning용어
- 자언어처리모델
- 마르코프 체인
- R 워드클라우드
- r word2vec
- R에서의 wordcloud
- WordCloud R
- R dataframe
- 자연어처리
- R에서의 워드클라우드
- StringJoiner
- HashMap
- RNN Attention
- 도날드노만
- self-attention
- 체험디자인
- 상호작용디자인
- StringBuffer vs StringBuilder
- Today
- Total
목록분류 전체보기 (36)
클로이의 데이터 여행기
좋은 디자인 특성 2가지 - 발견가능성 (discoverability) : 어떤 행동이 가능한지, 그 일을 어디에서 어떻게 할 수 있는지 알아내는 것이 가능해야 함 - 이해(understanding) : 이것이 어떤 뜻인가, 제품이 어떻게 쓰라고 만들어진 것인가 알 수 있어야 함 디자인 영역 산업 디자인 형태와 질을 강조 제품과 시스템의 기능,가치 및 외관을 최적화하는 개념과 명세사항을 만들고 개발 상호작용 디자인 이해가능성과 사용(편의)성을 강조 기술과 사람들이 상호작용하는 방식에 초점 체험 디자인 정서적 영향을 강조 전체 경험의 질과 즐거움에 초점 발견 가능성 1. 행위지원성(affordance) 물체의 속성과 행위자의 능력 간 관계성 ex. 어리거나 연약한 사람이 의자를 들 수 없다면, 그 의자는 ..
Product Owner로 직무전환을 하고 가장 난감했던 순간은 기획에 대한 디자인 시안을 공유 받고, 내 의견을 전달하는 순간이었다. 디자이너 분은 고민 끝에 다양한 시안을 가지고 와주시는데, 디자인 지식이 없는 내가 어떤 근거와 시각으로 의견을 드려야 할지 무척 고민이 되었다. 나의 상사분께 이런 고민에 대해 말씀드렸고, 디자인 대학원 3년동안 가장 인상깊고 도움된 책이라며 이 책을 권해주셨다. 이 책과 함께라면 Design Thinking이 어렵지 않을 것이란 쪽지와 함께! 요 책을 가볍게 읽고 싶지 않아서 블로그에 정리를 하며 읽어보려고 한다 :) 꼭꼭 씹으며 읽는 기록을 남겨보겠다. (직무전환 전 이 블로그는 기술 블로그에 가까웠는데, 갑자기 디자인이라니! 인생은 정말 대체 알 수가 없다. 매 ..
오늘은 한 필드에 담긴 값을 원하는 대로 나누어 담는 쿼리문을 다뤄보려고 합니다. SELECT searchKeyword, SUM(IF(order_time IN ('09','10','11','12','13','14','15','16') , 1 , 0)) AS time_1, SUM(IF(order_time IN ('17','18','19','20','21') , 1 , 0)) AS time_2, SUM(IF(order_time IN ('22','23','00','01','02','03','04','05','06','07','08') , 1 , 0)) AS time_3 FROM `directory1.directory2.keywordtable` 위의 쿼리문은 검색 키워드(searchKeyword)를 인입된 시간..
안녕하세요 : ) 이번 포스팅에서는 LinkedHashMap을 다뤄보려고 합니다. 텍스트 전처리를 하며 HashMap을 자주 사용하게 되는데요. 키워드 카운트와 같은 작업을 할 때 HashMap을 자주 사용합니다. 그런데 문장의 순서를 고려할 때는 HashMap을 사용하지 않았습니다. 왜냐하면 HashMap은 put된 순서대로 저장되지 않기 때문입니다. 그런데 LinkedHashMap을 활용하면 순서성을 보장하며 HashMap을 사용할 수 있다는 점을 알게되었습니다. 1. LinkedHashMap 특징 - 일반적 HashMap과 달리, 순서성을 보장한다. 2. HashMap과 LinkedHashMap의 비교 - 비교 코드 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1..
안녕하세요. 이번 포스팅에서는 Attention을 다뤄보려고 합니다. 1. Attention이란? - sequence 중 중요한 feature를 더욱 중요하게 고려하여 학습하는 모델 : 사람이 정보처리를 할 때, 모든 정보를 기억하지 않듯 '인간처럼 기억하자'가 컨셉 2. Attention과 RNN의 차이점 - RNN은 모든 정보를 하나의 context vector에 담음 : 입력 sequence의 길이가 매우 길면, 앞부분에 나왔던 token의 정보가 희석 - Attention은 중간중간에 나오는 output도 활용 : 문맥에 따라 encoder의 weight가 결정되어 Dynamic한 Context Vector로 활용 3. Attention 예시 RNN에서는 context vector에 해당하는 'h..
이번 포스팅에서는 'RNN'에 대해서 설명하고자 합니다. RNN은 앞서 설명드린 '마코프체인' 모델을 인공신경망 구조로 변환한 것이라 볼 수 있는데요. (※ 마코프 체인 관련 포스팅 : https://data-traveler.tistory.com/37 ) 1. RNN이란? - 순서성을 기반으로 다음값을 예측하는 인공신경망의 한 종류 - 시계열 데이터 분석에 적합하여, 자연어 처리에 널리 쓰임 : 다음 character, word, sentence를 예측 2. RNN 예시 그렇다면 RNN이 어떤 방식으로 순서를 학습하고, 또 다음을 예측하는지 살펴보겠습니다. 1) RNN 구조 ① Input Layer : 현재의 값 ② Hidden Layer : 다음을 예측하기 위해 이전 값의 특성을 담는 곳 ③ Outpu..
이번 포스팅에서는 자연어 분석의 전통적 모델인 '마코프 체인 모델'에 대해서 설명하고자 합니다. 1. 마코프 체인(Markov Chain)란? - 통계 기반의 모델로 다음 단어가 나올 확률을 예측하는 방식으로 언어분석 모델로 활용 - 초기의 딥러닝 모델 형태로 네트워크는 확률을 기반함 2. 마코프 체인(Markov Chain) 예시 그렇다면 실제로 마코프 체인을 어떻게 활용하는지 살펴보려고 합니다. 아래와 같은 문장이 있다고 예를 들어봅니다. [그림 1]처럼 문장들이 있다고 할 때, 하나의 단어를 기준으로 바로 뒤에 어떤 단어가 몇 번 등장하는지 살핍니다. 예를 들어, 'I' 뒤에는 'like'가 2번 등장하였고, 'don't'가 1번 등장하였습니다. 그러면 키워드별로 확률에 기반하여 아래의 [그림 2]..
지난 포스팅에서 TF-IDF를 활용하여 의미 있는 키워드를 뽑아보았습니다. 이번 포스팅에서는 이 키워드들을 활용하여 wordcloud를 그려보려고 합니다. wordcloud는 이미 많은 분들이 알고 계시듯 '비정형 텍스트에서 뽑은 키워드들을 시각화'하는 것인데요. wordcloud 결과를 보면 한 눈에 텍스트의 맥락을 이해할 수 있다는 장점을 가지고 있습니다. 1. R에서의 wordcloud 그렇다면 R에서는 wordcloud를 어떻게 쓸 수 있는지 살펴보겠습니다. R에서 wordcloud를 활용하는 방법은 간단합니다. 1) wordcloud 참고 코드 [ 라이브러리 ] - 'wordcloud2' : wordcloud를 그리는 라이브러리 - 'dplyr' : 데이터 조작을 간편하게 하는 R의 대표 라이브..