클로이의 데이터 여행기

[R] R을 이용한 텍스트마이닝_vector,list,matrix 본문

R

[R] R을 이용한 텍스트마이닝_vector,list,matrix

징느K 2019. 4. 9. 12:37

오늘 포스팅에서는 R에서 쓰이는 데이터 타입을 다뤄보려고 합니다. 

R에서 쓰는 데이터 타입은 크게 vector,list,matrix,dataframe이 있습니다.

기본적이지만 중요한 내용인 vector의 특징과 생성방법부터 차근차근 알아보도록 하겠습니다.

 

1. vector

 

 1) 특징

  - 데이터를 여러개 묶어 저장하는 방식

  - 하나의 데이터 타입(숫자면 숫자,문자면 문자)만 저장할 수 있습니다.

 

 

 2) 생성 

 ① 원하는 데이터 값 지정

   vec =  c(1,2,3,4)

   ▶ vec라는 이름으로 1,2,3,4의 값을 가진 vector가 생성됩니다

  .

 

② 지정된 범위만큼 연속된 값

   num = 1:25

    ▶ 1부터 25까지 1씩 증가한 값이 들어간 vector 'num'이 생성됩니다.

 

 

③ 지정된 범위에서 지정된 값만큼 증가되는 값

   dd = seq(1, 10, by=2)

     ▶ 1부터 10까지 2씩 증가한 값이 들어간 vector 'dd'가 생성됩니다.

 

 

 ④ 지정된 범위 안에서 N등분 

   e = seq(0, 12, length=3)

    ▶ 0부터 12를 3등분한 값이 들어간 vector 'e'가 생성됩니다.

 

 

 

 3) 데이터 다루기

  ① 데이터 길이 구하기

   length(vec)

    ▶ vec는 1,2,3,4의 값을 가진 vector이므로 길이는 '4'가 도출됩니다.

   

 인덱싱하기(원하는 위치의 데이터 가져오기)

  fruit[c(1:3)]

    ▶ vector 'fruit'의 1~3번째 데이터(1,2,3번째 데이터)를 가져옵니다.

  fruit[c(1,3)]

    ▶ vector 'fruit'의 1,3번째 데이터를 가져옵니다.

  fruit[c(-1,-3)]

    ▶ vector 'fruit'의 1,3번째 데이터를 제외하고 모두 가져옵니다.

 

실제 어떻게 작동되는지 아래에서 확인하시기 바랍니다.

 

 

2. list

 1) 특징

  - 데이터를 여러개 묶어 저장하는 방식

  - vector와 다른 점은 다양한 타입을 담을 수 있다는 것

 

2) 생성

   test = list("홍길동","대리",28,address)

   ▶list 'test'에 문자열 "홍길동", "대리", 숫자형 28, vector인  address까지 다양한 타입이 담깁니다.

 

3) 데이터 다루기

 ① list를 vector로 변경 : 'unlist'사용

    v1 <- unlist(test)

    ▶ test에 담긴 list데이터가 vector 'v1'으로 변경하며 모두 문자열로 변경됩니다.

 

실제로 어떻게 작동되는지는 아래에서 확인해주시기 바랍니다.

 

 

3. matrix

 

  1) 특징

  - 데이터를 행렬로 저장
  - 하나의 데이터 타입만 저장할 수 있음

 

2) 생성

mat = matrix( c(2, 4, 3, 1, 5, 7), nrow=2, ncol=3, byrow = TRUE)

    ▶ 2행 3열의 데이터가 행부터 채워지며 생성됩니다.

 

3) 데이터 다루

 ① matrix를 dataframe으로 변경

matToDf = as.data.frame(mat)

 

실제로 어떻게 작동되는지는 아래에서 확인해주시기 바랍니다.

 

이상입니다. 다음 포스팅에서는 dataframe에 대해 다루어보겠습니다.

읽어주셔서 감사합니다:D

Comments