Функции head() и tail() в R используются для отображения первых и последних n строк набора данных.
И у профессионала, и у новичка рано или поздно возникает необходимость читать большие наборы данных и анализировать их.
Огромный набор данных, в котором более 20 столбцов или даже больше тысячи строк, очень сложно обработать.
В этой статье мы рассмотрим функции head() и tail() в R, которые показывают первую и последнюю n строки соответственно.
Синтаксис функций head() и tail()
Посмотрим, как выглядят методы head() и tail().
Head(): функция, которая отображает первые n строки набора данных.
head(х, n = number)
Tail (): функция, которая отображает последние n строки набора данных.
tail(х, п = number)
Где:
- x = входной набор данных / фрейм.
- n = количество строк, которые должна отображать функция.
Функция head() в R
Функция head() в R используется для отображения первых n строк, присутствующих в фрейм данных.
Давайте попробуем получить первые n строк, используя функцию head().
Для этого мы импортируем набор данных ‘iris’, который по умолчанию доступен в R studio.
#importing the dataset df<-datasets::iris #returns first n rows of the data head(df)
Функция head() вернула первые 6 строк, которые есть в наборе данных iris.
Пользовательская настройка функции head().
По умолчанию head() показывает первые 6 строк.
А если нужны первые 10-15 строк из набора данных?
Для отображения определенного количества строк вы можете передать функции head числовой аргумент.
Посмотрим, как это работает:
#importing the data df<-datasets::airquality #returns first 10 rows head(df,n=10)
Теперь мы видим, что функция head() показала первые 10 строк, как мы указали во входных данных.
Вывод первых n значений в столбце.
В приведенных выше разделах функция head() возвращала весь набор значений, присутствующих в первых n строках набора данных.
Но также функция head() способна отображать значения определенного столбца.
С помощью такого фрагмента кода вы можете получить первые n значений указанного столбца.
#importing the data df<-datasets::mtcars #returns first 10 values in column 'mpg' head(mtcars$mpg,10) Output = 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2
Как и в примере выше, вы можете легко указать имя нужного столбца вместе с требуемым количеством строк. Вот и все.
Функция tail() в R
Функция tail() в R используется для отображения последних n строк набора данных.
Мы поговорим, как работает функция tail() и как её использовать в R.
Для этого мы используем набор данных ‘airquality’.
#importing the dataset df<-datasets::airquality #returns last n rows of the data tail(df)
На этом примере можно увидеть последние 6 строк набора данных airquality. Вот что будет делать функция tail() в R.
Пользовательская настройка функции tail()
Как и функция head(), tail() может показать последние n строк указанного числа.
#importing the data df<-datasets::airquality #returns the last 10 values tail(df,10)
Здесь видно, что функция tail() отобразила последние 10 строк, как указано нами в коде.
Вывод последних n значений в столбце
Функции head() и tail() выполняют одну и ту же работу совершенно противоположным образом.
Вы также можете использовать функцию tail() для получения последних n значений определенного столбца.
#importing the data df<-datasets::mtcars #returns the last 10 values of column 'mpg' tail(mtcars$mpg,10) Output = 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7 15.0 21.4
Если у вас такой результат, поздравляем! У вас всё получилось.
Вы можете указывать имя столбца вместе с количеством строк, чтобы получить требуемые значения, как в этом примере.
Заключение
Функции head() и tail() в R очень важны для чтения и анализа данных. В вышеприведенных примерах мы показали, как вы можете выполнять их пользовательскую настройку.
Простой синтаксис и понятные быстрые результаты – важные преимущества функций head() и tail().
Читайте также: Простое чтение данных из Google-таблиц в R