Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- self-attention
- deeplearning용어
- R에서의 워드클라우드
- 딥러닝개념
- StringJoiner
- R dataframe
- r word2vec
- HashMap
- 자언어처리모델
- StringBuffer vs StringBuilder
- 도날드노만
- word2vec
- WordCloud R
- RNN Attention
- wordVector
- deeplearning개념
- 마르코프
- 체험디자인
- 어탠션
- 마르코프 체인
- R 키워드 가중치
- 자연어처리
- R TF-IDF
- 상호작용디자인
- 딥러닝용어
- 언어모델
- R에서의 wordcloud
- selfattention
- 통계기반자연어처리
- R 워드클라우드
Archives
- Today
- Total
클로이의 데이터 여행기
[JAVA] 텍스트를 구분자로 나누어 배열에 담기 본문
자바공부(?)를 하며 처음으로 작성한 코드는 '텍스트파일을 읽어서 중복된 키워드를 카운팅하는 코드'입니다.
작성한 코드를 최대한 활용하고자 메소드로 단위로 나누어 블로그에 작성하고자 합니다.
첫번째로 설명할 메소드는 '긴 텍스트를 구분자로 나누어 배열로 담는 기능'을 수행합니다.
구분자로 나누기 전 텍스트를 소문자로 변환한 뒤, 쉼표를 기준으로 배열 arr에 담아 return 하였습니다.
1 2 3 4 5 6 7 8 9 | public static String[] splitLine(String a) { String sent = getLine().toLowerCase(); String[] arr = sent.split(","); for (int x = 0; x < arr.length; x++) { System.out.println("arr: "+arr[x]); } return arr; } | cs |
아주아주 간단한 코드지만 상세 설명을 달아보자면 :D
[변수]
- String a
: 이전 메소드에서 return받은 값으로 text 파일 전체를 한 라인으로 더함
- String sent
: text 파일 전체를 한 라인으로 더해(메소드 'getLine') 소문자로 변환(내장메소드 'toLowerCase')함
- String[] arr
: 변수 sent를 쉼표를 기준으로 split함
[메소드]
- getLine()
: 읽어 온 텍스트파일을 한 라인씩 가져와서 변수 a에 한 번에 담는 메소드
(* 텍스트파일을 읽는 메소드 설명 시, 작성하겠습니다:D )
- 문자열.toLowerCase();
: 문자열을 소문자로 변환하는 메소드
(키워드 카운트시 대소문자를 구분할 필요 없기 때문에 활용하는 메소드)
- 문자열.split("구분자")
: 구분자를 기준으로 문자열을 나눔(split)
간단하지만 텍스트 분석시 꼭 필요한 메소드에 대해 작성하였습니다.
'JAVA' 카테고리의 다른 글
[JAVA] eclipse 소소한 단축키 (2) | 2018.11.08 |
---|---|
[JAVA] 같은 key인 경우, value에 리스트(list)로 담기 (1) | 2018.10.22 |
[JAVA] HashMap에 <키워드,개수>의 형태로 넣기 (1) | 2018.10.22 |
[JAVA] 결과를 텍스트 파일(txt file)로 쓰기 (0) | 2018.10.10 |
[JAVA] 텍스트 파일(txt file)을 한 라인(line)씩 읽기 (0) | 2018.10.10 |
Comments