일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- R 키워드 가중치
- deeplearning용어
- 체험디자인
- R에서의 wordcloud
- 어탠션
- R dataframe
- 딥러닝개념
- 자연어처리
- R TF-IDF
- 도날드노만
- R 워드클라우드
- RNN Attention
- 마르코프
- WordCloud R
- HashMap
- StringBuffer vs StringBuilder
- selfattention
- r word2vec
- 상호작용디자인
- wordVector
- 딥러닝용어
- 통계기반자연어처리
- word2vec
- 언어모델
- R에서의 워드클라우드
- StringJoiner
- 자언어처리모델
- self-attention
- 마르코프 체인
- deeplearning개념
- Today
- Total
클로이의 데이터 여행기
[R] R을 이용한 텍스트마이닝_vector,list,matrix 본문
오늘 포스팅에서는 R에서 쓰이는 데이터 타입을 다뤄보려고 합니다.
R에서 쓰는 데이터 타입은 크게 vector,list,matrix,dataframe이 있습니다.
기본적이지만 중요한 내용인 vector의 특징과 생성방법부터 차근차근 알아보도록 하겠습니다.
1. vector
1) 특징
- 데이터를 여러개 묶어 저장하는 방식
- 하나의 데이터 타입(숫자면 숫자,문자면 문자)만 저장할 수 있습니다.
2) 생성
① 원하는 데이터 값 지정
vec = c(1,2,3,4)
▶ vec라는 이름으로 1,2,3,4의 값을 가진 vector가 생성됩니다
② 지정된 범위만큼 연속된 값
num = 1:25
▶ 1부터 25까지 1씩 증가한 값이 들어간 vector 'num'이 생성됩니다.
③ 지정된 범위에서 지정된 값만큼 증가되는 값
dd = seq(1, 10, by=2)
▶ 1부터 10까지 2씩 증가한 값이 들어간 vector 'dd'가 생성됩니다.
④ 지정된 범위 안에서 N등분
e = seq(0, 12, length=3)
▶ 0부터 12를 3등분한 값이 들어간 vector 'e'가 생성됩니다.
3) 데이터 다루기
① 데이터 길이 구하기
length(vec)
▶ vec는 1,2,3,4의 값을 가진 vector이므로 길이는 '4'가 도출됩니다.
② 인덱싱하기(원하는 위치의 데이터 가져오기)
fruit[c(1:3)]
▶ vector 'fruit'의 1~3번째 데이터(1,2,3번째 데이터)를 가져옵니다.
fruit[c(1,3)]
▶ vector 'fruit'의 1,3번째 데이터를 가져옵니다.
fruit[c(-1,-3)]
▶ vector 'fruit'의 1,3번째 데이터를 제외하고 모두 가져옵니다.
실제 어떻게 작동되는지 아래에서 확인하시기 바랍니다.
2. list
1) 특징
- 데이터를 여러개 묶어 저장하는 방식
- vector와 다른 점은 다양한 타입을 담을 수 있다는 것
2) 생성
test = list("홍길동","대리",28,address)
▶list 'test'에 문자열 "홍길동", "대리", 숫자형 28, vector인 address까지 다양한 타입이 담깁니다.
3) 데이터 다루기
① list를 vector로 변경 : 'unlist'사용
v1 <- unlist(test)
▶ test에 담긴 list데이터가 vector 'v1'으로 변경하며 모두 문자열로 변경됩니다.
실제로 어떻게 작동되는지는 아래에서 확인해주시기 바랍니다.
3. matrix
1) 특징
- 데이터를 행렬로 저장
- 하나의 데이터 타입만 저장할 수 있음
2) 생성
mat = matrix( c(2, 4, 3, 1, 5, 7), nrow=2, ncol=3, byrow = TRUE)
▶ 2행 3열의 데이터가 행부터 채워지며 생성됩니다.
3) 데이터 다루기
① matrix를 dataframe으로 변경
matToDf = as.data.frame(mat)
실제로 어떻게 작동되는지는 아래에서 확인해주시기 바랍니다.
이상입니다. 다음 포스팅에서는 dataframe에 대해 다루어보겠습니다.
읽어주셔서 감사합니다:D
'R' 카테고리의 다른 글
[R] R을 이용한 텍스트마이닝_TF-IDF (코드 및 설명) (0) | 2019.06.20 |
---|---|
[R] R을 이용한 텍스트마이닝_Word2vec(코드 및 설명) (3) | 2019.05.31 |
[R] R을 이용한 텍스트마이닝_'stringr' package (0) | 2019.04.19 |
[R] R을 이용한 텍스트마이닝_DataFrame (0) | 2019.04.16 |
[R] R을 이용한 텍스트마이닝_prologue (0) | 2019.03.19 |