일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- word2vec
- R 워드클라우드
- 딥러닝용어
- selfattention
- StringBuffer vs StringBuilder
- 통계기반자연어처리
- HashMap
- 딥러닝개념
- WordCloud R
- 체험디자인
- R에서의 워드클라우드
- self-attention
- R에서의 wordcloud
- RNN Attention
- StringJoiner
- 자연어처리
- R dataframe
- deeplearning용어
- deeplearning개념
- 도날드노만
- 언어모델
- 어탠션
- 자언어처리모델
- r word2vec
- 마르코프
- 마르코프 체인
- wordVector
- R TF-IDF
- 상호작용디자인
- R 키워드 가중치
- Today
- Total
클로이의 데이터 여행기
이번 포스팅에서 다룰 내용은 '문자열 처리에서 자주 쓰이는 클래스'입니다. 문자열 처리를 하다보면 반복적으로 쓰이는 클래스가 있는데요. 해당 내용 정리해두고 편리하게 참고하고자 합니다. 1. 문자열 비교하기① equals() 기능 두개의 문자열이 같은 지 비교하는 클래스 사용법 "문자열A".equals("문자열B") 2) 문자열 치환하기/바꾸기/변경하기① replace() 기능 문자열의 특정 부분을 치환하는 클래스 사용법 .replace("치환할것","치환될것") ② replaceAll() 기능 문자열의 특정부분을 치환하는 클래스 (replace와 다른 점은 정규식을 활용 할 수 있다는 점) 사용법 .replaceAll("치환할것","치환될것") ③ replaceFirst() 기능 문자열 치환 클래스로 ..
이번 포스팅에는 '키워드를 카운트 하는 코드'를 다뤄보려합니다.코드 목적은 '대량의 문장을 읽어와서, 어떤 단어들이 자주 쓰였는지 카운트 하는 것' 입니다. 코드는 메소드 3개로 구성되어 있으며 내용은 메소드별 설명은 아래와 같습니다. ① getData() - 메소드 기능 : 문장을 공백 단위로 끊어 rawList에 담음. - 상세내용 : 대체/제거하고 싶은 특수문자 처리한 뒤, 문장을 공백으로 spilt하여 rawList로 담음. ② getCoreComp() - 메소드 기능 : 핵심역량 키워드의 카운트 - 상세내용 : rawList에 중복으로 담겨있는 키워드를 뽑아와서 coreCntMap로 담음. 이 때, coreCntMap에 이미 담겨있으면 카운트(value)에 1을 더함. ③ writeFile()-..
이번 포스팅에서 살펴볼 내용은 '문자열 연결 처리 속도를 높이는 방법'입니다. 다양한 문자열(Stirng, StringBuffer,StringBuilder, StringJoiner) 선언 방법과 특징은 이전 포스팅(https://data-traveler.tistory.com/21)에서 다루었으니 참고부탁드립니다. 앞선 포스팅에서 말씀드렸던 것처럼, 문자열 연결을 할 때, String 선언 후 +연산자를 활용하여 문자열을 연결하는 방법 보다는 StringBuffer,StringBuilder등으로 선언 후 append메서드로 문자열을 축적하는 방법이 처리속도를 높이는데는 효과적이라고 알려져있는데요. 실제로 속도차이가 얼마나 나는지 테스트해보고, 문자열 메소드별 활용방법에 대해 알아보려고 합니다. 1. 테스트..
이번 포스팅에서는 '문자열 선언방법 비교'에 대해 알아보려고 합니다.문자열 선언하는 방법이 많은 이유가 궁금했는데요. 아래에서 자세히 살펴보겠습니다. 1. 문자열을 선언하는 2가지 방법 문자열을 선언하는 방법은 크게 두 가지로 나눌 수 있습니다.'String 클래스로 곧바로 선언하는 방법'과 다른 클래스 처럼 'new를 활용하여 선언하는 방법'입니다. 상세 설명 및 비교는 아래와 같습니다. 'String' 사용 'new 연산자'사용ex. StringBuffer,StringBuilder 방법 String text = "사과"; String text = new String("사과"); 내용 string 데이터를 불변의 클래스로 설정 new 연산자를 통해 String 클래스를 선언 장점 작성방법 간단함 문자열..
오늘 포스팅에서는 'isFile(),isDirectory(),exists()를 비교' 해보려고 합니다. 세가지 메소드는 파일/폴더가 있는지 확인하여 파일/폴더가 없어서 생기는 에러를 방지하기 위해 주로 사용됩니다. 1) 메소드 비교 메소드명 설명경로.isFile() 경로가 file인지 확인한다.경로.isDirectory() 경로가 directory(folder)인지 확인한다. 경로.exists() 경로에 file/directory(folder)가 존재하는지 확인한다. 2) 실제 결과 비교 ① 테스트할 디렉토리에 파일과 하위디렉토리를 넣어두었습니다. 아래의 [사진1]을 보시면 "C:\data\input\TestFile"에 파일 2개 (0000.txt,0001.txt)와 디렉토리(0002)가 있는것을 알 수..
이번 포스팅에서는 '동일한 값(데이터) 기준으로 데이터를 결합'하는 소스를 살펴보려고 합니다. 아래와 같이 [그림1]과 같은 데이터를 [그림2]처럼 결합하고자 할 때가 있는데요. [그림1] [그림2] 엑셀에서 작업시에는 필터 기능을 사용하여 직급별로 sorting 후 복사 붙여넣기 하곤 했습니다.따로 코딩없이 작업이 가능하지만, 분류(예를들면 그림에서는 '직급')값이 엄청나게 다양하다면 많은 시간이 든다는 단점이 있었습니다. 그래서 효율적인 업무진행을 위해 아래와 같이 동일한 key값을 기준으로 원하는 필드의 내용을 리스트로 담아 결합하는 소스를 작성하였습니다. 소스 사용 시에는, 아래의 값들을 main에 넣어주시면 됩니다. - 합치고자 하는 파일명과 경로 : rawFile - 합치고자 하는 열이 몇 번..
이번 포스팅에서는 equals와 ==가 어떻게 다른지 알아보려고 합니다.정확한 기능을 알지 못한 채, 코드를 작성하다보니 문자열을 비교 할 때마다 헷갈렸는데요. 이번 기회에 해당 내용을 포스팅을 하며 제대로 알아보려고 합니다. [ equals와 == 비교/차이 정리 ] equals == 카테고리 메소드 연산자 기능 객체의 내용(값)을 비교함. 문자열을 비교함. 객체 자체를 비교함. 같은 메모리 공간(주소)을 사용하는지 비교함. 사용법(a와 b 비교시) a.equals(b) a == b [ equals와 == 비교/차이 코드작성 ] 실제로 어떻게 작동되는지, 아래와 같이 코드로 작성하여 테스트 해보았습니다. 소스를 보면 't1'과 't2'의 객체를 다르게 설정하고, 문자열을 동일하게 입력하였습니다. 출력결..
오늘 포스팅 내용은 'AR(연관분석) 알고리즘'입니다. 공개된 소스를 사용하려고 했으나 결국 동료 연구원님의 도움을 받아 소스를 작성하게 되었습니다. 이 소스를 활용해서 구직자들의 경력기업리스트를 활용하여 연관기업명을 추출하였습니다. 동종 업종으로의 이직이 많을 것이라는 가정에서 시작하였습니다. 아래의 소스는 포스팅용으로 간단히 수정한 내용입니다. 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293package test; import java..