head() и tail() в R: подробный справочник

Функции head() и tail() в R используются для отображения первых и последних n строк набора данных.

И у профессионала, и у новичка рано или поздно возникает необходимость читать большие наборы данных и анализировать их.

Огромный набор данных, в котором более 20 столбцов или даже больше тысячи строк, очень сложно обработать.

В этой статье мы рассмотрим функции head() и tail() в R, которые показывают первую и последнюю n строки соответственно.

Синтаксис функций head() и tail()

Посмотрим, как выглядят методы head() и tail().

Head(): функция, которая отображает первые n строки набора данных.

head(х, n = number)

Tail (): функция, которая отображает последние n строки набора данных.

tail(х, п = number)

Где:

  • x = входной набор данных / фрейм.
  • n = количество строк, которые должна отображать функция.

Функция head() в R

Функция head() в R используется для отображения первых n строк, присутствующих в фрейм данных.

Давайте попробуем получить первые n строк, используя функцию head().

Для этого мы импортируем набор данных ‘iris’, который по умолчанию доступен в R studio.

#importing the dataset
df<-datasets::iris

#returns first n rows of the data
head(df)

Функция head() вернула первые 6 строк, которые есть в наборе данных iris.

Пользовательская настройка функции head().

По умолчанию head() показывает первые 6 строк.

А если нужны первые 10-15 строк из набора данных?

Для отображения определенного количества строк вы можете передать функции head числовой аргумент.

Посмотрим, как это работает:

#importing the data
df<-datasets::airquality

#returns first 10 rows
head(df,n=10)

Теперь мы видим, что функция head() показала первые 10 строк, как мы указали во входных данных. 

Вывод первых n значений в столбце.

В приведенных выше разделах функция head() возвращала весь набор значений, присутствующих в первых n строках набора данных.

Но также функция head() способна отображать значения определенного столбца.

С помощью такого фрагмента кода вы можете получить первые n значений указанного столбца.

#importing the data
df<-datasets::mtcars

#returns first 10 values in column 'mpg'
head(mtcars$mpg,10)

Output = 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2

Как и в примере выше, вы можете легко указать имя нужного столбца вместе с требуемым количеством строк. Вот и все.

Функция tail() в R

Функция tail() в R используется для отображения последних n строк набора данных.

Мы поговорим, как работает функция tail() и как её использовать в R.

Для этого мы используем набор данных ‘airquality’.

#importing the dataset 
df<-datasets::airquality

#returns last n rows of the data
tail(df)

На этом примере можно увидеть последние 6 строк набора данных airquality. Вот что будет делать функция tail() в R.

Пользовательская настройка функции tail()

Как и функция head(), tail() может показать последние n строк указанного числа.

#importing the data
df<-datasets::airquality

#returns the last 10 values 
tail(df,10)

Здесь видно, что функция tail() отобразила последние 10 строк, как указано нами в коде.

Вывод последних n значений в столбце

Функции head() и tail() выполняют одну и ту же работу совершенно противоположным образом.

Вы также можете использовать функцию tail() для получения последних n значений определенного столбца.

#importing the data
df<-datasets::mtcars

#returns the last 10 values of column 'mpg'
tail(mtcars$mpg,10)

Output = 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7 15.0 21.4

Если у вас такой результат, поздравляем! У вас всё получилось.

Вы можете указывать имя столбца вместе с количеством строк, чтобы получить требуемые значения, как в этом примере.

Заключение

Функции head() и tail() в R очень важны для чтения и анализа данных. В вышеприведенных примерах мы показали, как вы можете выполнять их пользовательскую настройку.

Простой синтаксис и понятные быстрые результаты – важные преимущества функций head() и tail().

Читайте также: Простое чтение данных из Google-таблиц в R

Tags:

Добавить комментарий