일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 마르코프 체인
- selfattention
- word2vec
- 마르코프
- wordVector
- 자언어처리모델
- 딥러닝개념
- StringJoiner
- 자연어처리
- deeplearning개념
- R에서의 wordcloud
- 딥러닝용어
- 도날드노만
- HashMap
- RNN Attention
- self-attention
- 상호작용디자인
- R dataframe
- r word2vec
- 언어모델
- R 키워드 가중치
- 체험디자인
- R TF-IDF
- WordCloud R
- R에서의 워드클라우드
- 통계기반자연어처리
- R 워드클라우드
- deeplearning용어
- StringBuffer vs StringBuilder
- 어탠션
- Today
- Total
목록JAVA (19)
클로이의 데이터 여행기
안녕하세요 : ) 이번 포스팅에서는 LinkedHashMap을 다뤄보려고 합니다. 텍스트 전처리를 하며 HashMap을 자주 사용하게 되는데요. 키워드 카운트와 같은 작업을 할 때 HashMap을 자주 사용합니다. 그런데 문장의 순서를 고려할 때는 HashMap을 사용하지 않았습니다. 왜냐하면 HashMap은 put된 순서대로 저장되지 않기 때문입니다. 그런데 LinkedHashMap을 활용하면 순서성을 보장하며 HashMap을 사용할 수 있다는 점을 알게되었습니다. 1. LinkedHashMap 특징 - 일반적 HashMap과 달리, 순서성을 보장한다. 2. HashMap과 LinkedHashMap의 비교 - 비교 코드 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1..
안녕하세요:) 오늘은 자바로 '동의어 처리 후 키워드 카운트하는 알고리즘'에 대해 살펴보려고 합니다. 이전에 '키워드 카운트 알고리즘(https://data-traveler.tistory.com/23?category=719589)'은 다룬적이 있는데요. 혹 동의어 처리가 따로 필요없는 데이터라면 위의 포스팅을 활용하시는게 좋겠습니다. package highFrequency; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileInputStream; import java.io.FileWriter; import java.io.IOException; import java.io.In..
이번 포스팅에서 다룰 내용은 1:다 데이터를 1:1로 바꾸는 방법입니다. 아래의 포스팅 내용과 반대되는 내용입니다. 동일한 값(KEY값,대표어)를 기준으로 결합하는 방법이 궁금하시다면 링크의 포스팅을 참고하시기 바랍니다. (https://data-traveler.tistory.com/19?category=719589) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 package synForR; import ..
이번 포스팅에서 다룰 내용은 '문자열 처리에서 자주 쓰이는 클래스'입니다. 문자열 처리를 하다보면 반복적으로 쓰이는 클래스가 있는데요. 해당 내용 정리해두고 편리하게 참고하고자 합니다. 1. 문자열 비교하기① equals() 기능 두개의 문자열이 같은 지 비교하는 클래스 사용법 "문자열A".equals("문자열B") 2) 문자열 치환하기/바꾸기/변경하기① replace() 기능 문자열의 특정 부분을 치환하는 클래스 사용법 .replace("치환할것","치환될것") ② replaceAll() 기능 문자열의 특정부분을 치환하는 클래스 (replace와 다른 점은 정규식을 활용 할 수 있다는 점) 사용법 .replaceAll("치환할것","치환될것") ③ replaceFirst() 기능 문자열 치환 클래스로 ..
이번 포스팅에는 '키워드를 카운트 하는 코드'를 다뤄보려합니다.코드 목적은 '대량의 문장을 읽어와서, 어떤 단어들이 자주 쓰였는지 카운트 하는 것' 입니다. 코드는 메소드 3개로 구성되어 있으며 내용은 메소드별 설명은 아래와 같습니다. ① getData() - 메소드 기능 : 문장을 공백 단위로 끊어 rawList에 담음. - 상세내용 : 대체/제거하고 싶은 특수문자 처리한 뒤, 문장을 공백으로 spilt하여 rawList로 담음. ② getCoreComp() - 메소드 기능 : 핵심역량 키워드의 카운트 - 상세내용 : rawList에 중복으로 담겨있는 키워드를 뽑아와서 coreCntMap로 담음. 이 때, coreCntMap에 이미 담겨있으면 카운트(value)에 1을 더함. ③ writeFile()-..
이번 포스팅에서 살펴볼 내용은 '문자열 연결 처리 속도를 높이는 방법'입니다. 다양한 문자열(Stirng, StringBuffer,StringBuilder, StringJoiner) 선언 방법과 특징은 이전 포스팅(https://data-traveler.tistory.com/21)에서 다루었으니 참고부탁드립니다. 앞선 포스팅에서 말씀드렸던 것처럼, 문자열 연결을 할 때, String 선언 후 +연산자를 활용하여 문자열을 연결하는 방법 보다는 StringBuffer,StringBuilder등으로 선언 후 append메서드로 문자열을 축적하는 방법이 처리속도를 높이는데는 효과적이라고 알려져있는데요. 실제로 속도차이가 얼마나 나는지 테스트해보고, 문자열 메소드별 활용방법에 대해 알아보려고 합니다. 1. 테스트..
이번 포스팅에서는 '문자열 선언방법 비교'에 대해 알아보려고 합니다.문자열 선언하는 방법이 많은 이유가 궁금했는데요. 아래에서 자세히 살펴보겠습니다. 1. 문자열을 선언하는 2가지 방법 문자열을 선언하는 방법은 크게 두 가지로 나눌 수 있습니다.'String 클래스로 곧바로 선언하는 방법'과 다른 클래스 처럼 'new를 활용하여 선언하는 방법'입니다. 상세 설명 및 비교는 아래와 같습니다. 'String' 사용 'new 연산자'사용ex. StringBuffer,StringBuilder 방법 String text = "사과"; String text = new String("사과"); 내용 string 데이터를 불변의 클래스로 설정 new 연산자를 통해 String 클래스를 선언 장점 작성방법 간단함 문자열..
오늘 포스팅에서는 'isFile(),isDirectory(),exists()를 비교' 해보려고 합니다. 세가지 메소드는 파일/폴더가 있는지 확인하여 파일/폴더가 없어서 생기는 에러를 방지하기 위해 주로 사용됩니다. 1) 메소드 비교 메소드명 설명경로.isFile() 경로가 file인지 확인한다.경로.isDirectory() 경로가 directory(folder)인지 확인한다. 경로.exists() 경로에 file/directory(folder)가 존재하는지 확인한다. 2) 실제 결과 비교 ① 테스트할 디렉토리에 파일과 하위디렉토리를 넣어두었습니다. 아래의 [사진1]을 보시면 "C:\data\input\TestFile"에 파일 2개 (0000.txt,0001.txt)와 디렉토리(0002)가 있는것을 알 수..