[R] R을 이용한 텍스트마이닝

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

클로이의 데이터 여행기

[R] R을 이용한 텍스트마이닝_vector,list,matrix 본문

[R] R을 이용한 텍스트마이닝_vector,list,matrix

징느K 2019. 4. 9. 12:37

오늘 포스팅에서는 R에서 쓰이는 데이터 타입을 다뤄보려고 합니다.

R에서 쓰는 데이터 타입은 크게 vector,list,matrix,dataframe이 있습니다.

기본적이지만 중요한 내용인 vector의 특징과 생성방법부터 차근차근 알아보도록 하겠습니다.

1. vector

1) 특징

- 데이터를 여러개 묶어 저장하는 방식

- 하나의 데이터 타입(숫자면 숫자,문자면 문자)만 저장할 수 있습니다.

2) 생성

① 원하는 데이터 값 지정

vec = c(1,2,3,4)

▶ vec라는 이름으로 1,2,3,4의 값을 가진 vector가 생성됩니다

② 지정된 범위만큼 연속된 값

num = 1:25

▶ 1부터 25까지 1씩 증가한 값이 들어간 vector 'num'이 생성됩니다.

③ 지정된 범위에서 지정된 값만큼 증가되는 값

dd = seq(1, 10, by=2)

▶ 1부터 10까지 2씩 증가한 값이 들어간 vector 'dd'가 생성됩니다.

④ 지정된 범위 안에서 N등분

e = seq(0, 12, length=3)

▶ 0부터 12를 3등분한 값이 들어간 vector 'e'가 생성됩니다.

3) 데이터 다루기

① 데이터 길이 구하기

length(vec)

▶ vec는 1,2,3,4의 값을 가진 vector이므로 길이는 '4'가 도출됩니다.

② 인덱싱하기(원하는 위치의 데이터 가져오기)

fruit[c(1:3)]

▶ vector 'fruit'의 1~3번째 데이터(1,2,3번째 데이터)를 가져옵니다.

fruit[c(1,3)]

▶ vector 'fruit'의 1,3번째 데이터를 가져옵니다.

fruit[c(-1,-3)]

▶ vector 'fruit'의 1,3번째 데이터를 제외하고 모두 가져옵니다.

실제 어떻게 작동되는지 아래에서 확인하시기 바랍니다.

2. list

1) 특징

- 데이터를 여러개 묶어 저장하는 방식

- vector와 다른 점은 다양한 타입을 담을 수 있다는 것

2) 생성

test = list("홍길동","대리",28,address)

▶list 'test'에 문자열 "홍길동", "대리", 숫자형 28, vector인 address까지 다양한 타입이 담깁니다.

3) 데이터 다루기

① list를 vector로 변경 : 'unlist'사용

v1 <- unlist(test)

▶ test에 담긴 list데이터가 vector 'v1'으로 변경하며 모두 문자열로 변경됩니다.

실제로 어떻게 작동되는지는 아래에서 확인해주시기 바랍니다.

3. matrix

1) 특징

- 데이터를 행렬로 저장
- 하나의 데이터 타입만 저장할 수 있음

2) 생성

mat = matrix( c(2, 4, 3, 1, 5, 7), nrow=2, ncol=3, byrow = TRUE)

▶ 2행 3열의 데이터가 행부터 채워지며 생성됩니다.

3) 데이터 다루기

① matrix를 dataframe으로 변경

matToDf = as.data.frame(mat)

실제로 어떻게 작동되는지는 아래에서 확인해주시기 바랍니다.

이상입니다. 다음 포스팅에서는 dataframe에 대해 다루어보겠습니다.

읽어주셔서 감사합니다:D

'R' 카테고리의 다른 글

[R] R을 이용한 텍스트마이닝_TF-IDF (코드 및 설명) (0)	2019.06.20
[R] R을 이용한 텍스트마이닝_Word2vec(코드 및 설명) (3)	2019.05.31
[R] R을 이용한 텍스트마이닝_'stringr' package (0)	2019.04.19
[R] R을 이용한 텍스트마이닝_DataFrame (0)	2019.04.16
[R] R을 이용한 텍스트마이닝_prologue (0)	2019.03.19

'R' Related Articles

Comments

클로이의 데이터 여행기

[R] R을 이용한 텍스트마이닝_vector,list,matrix 본문

[R] R을 이용한 텍스트마이닝_vector,list,matrix

1. vector

2. list

3. matrix

'R' 카테고리의 다른 글

티스토리툴바