Skip to main content
Advanced Search
Search Terms
Content Type

Exact Matches
Tag Searches
Date Options
Updated after
Updated before
Created after
Created before

Search Results

343 total results found

Hướng dẫn cài đặt Apache Spark trên CentOS

Apache Spark Apache Spark basic

Hướng dẫn cài đặt Apache Spark trên CentOS Tải xuống Apache Spark từ trang web chính thức của Spark: https://spark.apache.org/downloads.html Giải nén tệp tar bằng lệnh sau: tar -xvf spark-3.1.2-bin-hadoop3.2.tgz Trong đó, spark-3.1.2-bin-hadoop3.2....

Thuật toán sắp xếp trộn (Merge sort)

Thuật toán

Thuật toán sắp xếp trộn (Merge sort) là một thuật toán sắp xếp đệ quy được sử dụng rộng rãi trong các ứng dụng thực tế. Cách thức hoạt động của thuật toán này như sau: Chia danh sách cần sắp xếp thành hai phần bằng nhau. Sắp xếp hai phần đó bằng cách sử dụng...

Thuật toán Dijkstra

Thuật toán

Thuật toán Dijkstra là một thuật toán tìm đường đi ngắn nhất từ một đỉnh đến tất cả các đỉnh còn lại trong đồ thị có trọng số không âm. Thuật toán này được đặt tên theo nhà toán học Edsger W. Dijkstra và được công bố lần đầu tiên vào năm 1959. Bước đầu tiên ...

Thuật toán cây AVL

Thuật toán

Cây AVL là một cấu trúc dữ liệu tương tự như cây đỏ đen, được thiết kế để giảm thiểu chi phí của các phép cập nhật, bao gồm cả chèn và xóa. Các nút trong cây AVL được đánh số thứ tự theo giá trị các nút, và phải tuân thủ một số quy tắc nhất định để đảm bảo rằn...

Thuật toán cây đỏ đen (Red-black tree)

Thuật toán

Cây đỏ đen (Red-black tree) là một cấu trúc dữ liệu dạng cây nhị phân tương tự như cây nhị phân tìm kiếm (BST). Tuy nhiên, cây đỏ đen được thiết kế để giảm thiểu chi phí của các phép cập nhật, bao gồm cả chèn và xóa. Các nút trong cây đỏ đen được đánh dấu bằng...

Thuật toán cây nhị phân tìm kiếm (BST)

Thuật toán

Cây nhị phân tìm kiếm (BST) là một cấu trúc dữ liệu rất mạnh mẽ và được sử dụng rộng rãi trong các ứng dụng thực tế. Nó là một cấu trúc dữ liệu dạng cây, trong đó mỗi nút chứa một giá trị và hai con trỏ tới hai nút con của nó: nút con bên trái và nút con bên p...

Thuật toán đệ quy tuyến tính (Linear recursive algorithm)

Thuật toán

Thuật toán đệ quy tuyến tính (Linear recursive algorithm) là một phương pháp tìm kiếm giá trị trong một danh sách đã cho bằng cách sử dụng đệ quy. Quá trình tìm kiếm được thực hiện bằng cách so sánh giá trị cần tìm với từng phần tử trong danh sách theo thứ tự ...

Thuật toán đệ quy nhị phân (Binary recursive algorithm)

Thuật toán

Thuật toán đệ quy nhị phân (Binary recursive algorithm) là một thuật toán sắp xếp đặc biệt được sử dụng để tìm kiếm các giá trị trong một danh sách đã sắp xếp. Cách thức hoạt động của thuật toán này như sau: Tìm giá trị trung bình của danh sách đã sắp xếp. ...

Thuật toán tìm kiếm tuyến tính (Linear search)

Thuật toán

Tìm kiếm tuyến tính (Linear search) là một thuật toán đơn giản nhất trong các thuật toán tìm kiếm dữ liệu. Cách thức hoạt động của thuật toán này như sau: Để tìm phần tử x trong danh sách đã cho, ta duyệt từ đầu đến cuối danh sách. Nếu phần tử được tìm thấy...

Thuật toán sắp xếp chèn (Insertion sort)

Thuật toán

Thuật toán sắp xếp chèn (Insertion sort) là một trong số thuật toán sắp xếp đơn giản nhất trong các thuật toán sắp xếp cơ bản. Cách thức hoạt động của thuật toán này như sau: Bắt đầu với danh sách chưa sắp xếp, ta lấy phần tử đầu tiên và chèn nó vào danh sách...

Hướng dẫn cài đặt Apache Spark trên Windows

Apache Spark Apache Spark basic

Hướng dẫn cài đặt Apache Spark trên Windows Tải xuống Apache Spark từ trang web chính thức của Spark: https://spark.apache.org/downloads.html Giải nén tệp zip bằng công cụ giải nén tệp zip. Di chuyển thư mục Spark vừa được giải nén đến một đường...

Thuật toán sắp xếp chọn (Selection sort)

Thuật toán

Thuật toán sắp xếp chọn (Selection sort) là thuật toán sắp xếp đơn giản nhất trong các thuật toán sắp xếp cơ bản. Cách thức hoạt động của thuật toán này như sau: Tìm phần tử nhỏ nhất trong danh sách. Đưa phần tử nhỏ nhất này về vị trí đầu tiên của danh sách....

Các thuật toán cơ bản

Thuật toán

Thuật toán Trong khoa học máy tính, thuật toán là một tập hợp các hướng dẫn hoặc quy trình được sử dụng để giải quyết một vấn đề tính toán. Dưới đây là một số thuật toán cơ bản: Thuật toán sắp xếp: Là thuật toán sắp xếp các phần tử trong một danh sách hoặc m...

Apache Spark SQL - Parquet File

Apache Spark Apache Spark basic

Để đọc dữ liệu từ một tệp Parquet trong Spark SQL, bạn có thể sử dụng phương thức read() của đối tượng SparkSession và chỉ định đường dẫn đến tệp (ví dụ: spark.read.parquet("path/to/file.parquet")). Bạn cũng có thể chỉ định các tùy chọn cấu hình khác nhau đ...

Apache Spark SQL - Hive Table

Apache Spark Apache Spark basic

Để đọc dữ liệu từ Hive table trong Spark SQL, bạn có thể sử dụng phương thức read() của đối tượng SparkSession và chỉ định đường dẫn đến Hive table bằng cú pháp database.table (ví dụ: spark.read.table("default.mytable")). Bạn cũng có thể chỉ định các tùy ch...

Apache Spark SQL - JSON Dataset

Apache Spark Apache Spark basic

Spark SQL cho phép đọc và xử lý dữ liệu từ các tệp JSON trong các ứng dụng của bạn. Khi bạn đọc dữ liệu từ tệp JSON, Spark SQL sẽ tạo ra một DataFrame để lưu trữ dữ liệu. DataFrame này cung cấp các tính năng truy vấn và biến đổi dữ liệu giống như DataFrame đượ...

Apache Spark SQL - Data Sources

Apache Spark Apache Spark basic

Spark SQL cung cấp nhiều cách để đọc dữ liệu từ các nguồn khác nhau. Bao gồm: Đọc dữ liệu từ một tệp văn bản: bạn có thể đọc dữ liệu từ các tệp văn bản như CSV, TSV, và các tệp khác bằng cách sử dụng phương thức read() của đối tượng SparkSession và chỉ địn...

Apache Spark SQL - DataFrame

Apache Spark Apache Spark basic

Trong Apache Spark SQL, DataFrame là một cấu trúc dữ liệu phân tán giống như bảng trong cơ sở dữ liệu quan hệ. DataFrame cung cấp các tính năng và lợi ích của các cấu trúc dữ liệu phân tán như khả năng xử lý dữ liệu lớn, tính toán song song và khả năng tối ưu ...

Apache Spark SQL

Apache Spark Apache Spark basic

Apache Spark SQL là một trong những thành phần quan trọng của Apache Spark, được sử dụng để xử lý dữ liệu có cấu trúc. Nó là một công cụ mạnh mẽ cho các nhà phát triển và nhà nghiên cứu dữ liệu để truy vấn và xử lý dữ liệu từ nhiều nguồn khác nhau như HDFS, Hi...

Thuật toán Bellman-Ford

Thuật toán

Thuật toán Bellman-Ford là một thuật toán tìm đường đi ngắn nhất từ một đỉnh đến tất cả các đỉnh còn lại trong đồ thị có trọng số âm hoặc không. Thuật toán này được đặt tên theo nhà toán học Richard Bellman và Lester Ford Jr. và được công bố lần đầu tiên vào n...