9-Tạo kiểu tham số và đệ quy

Outline

Parameterizing Types
- Prameteryzing type synonyms
- Prameteryzing data types
Recursive data types
- Tweet me a river
- A Sequence of Nodes
- A Tree of Nodes
Kinds
The newType keyword

Các kiểu tham số

Một hàm tạo giá trị lấy các giá trị làm tham số và tạo ra một giá trị .

                        |
                        v

Một hàm tạo kiểu lấy các kiểu làm tham số và tạo ra một kiểu .

Chúng ta có thể sử dụng các hàm tạo kiểu với cả kiểu từ đồng nghĩa và kiểu mới. Hãy bắt đầu với kiểu từ đồng nghĩa.

Tham số hóa kiểu từ đồng nghĩa

Quay trở lại với kiểu từ đồng nghĩa cuối cùng của chúng ta từ bài giảng trước, chúng ta đã có:

type Name = String
type Address = (String, Int)

type Person = (Name, Address)

bob = ("Bob Smith", ("Main St.", 555)) :: Person

Hãy tưởng tượng rằng, sau khi sử dụng một thời gian, chúng ta phát hiện ra rằng chúng ta cũng phải xác định các công ty theo id số và nhà cung cấp theo id chữ và số của họ.

Chúng ta có thể làm một cái gì đó như:

type Address = (String, Int)
type Name = String
type CompanyId = Int
type ProviderId = String

type Person = (Name, Address)
type Company = (CompanyId, Address)
type Provider = (ProviderId, Address)

bob = ("Bob Smith", ("Main St.", 555)) :: Person
io = (584264, ("Cardano St.", 999)) :: Company
google = ("Google LLC", ("Amphitheatre Parkway", 1600)) :: Provider

Trong trường hợp này, chúng ta thêm bốn từ đồng nghĩa kiểu. Các từ đồng nghĩa CompanyId , ProviderId , Company và Provider .

Chúng ta nhận được kết quả mong muốn của mình, nhưng phải trả giá bằng việc lặp lại cùng một cấu trúc ba lần ( Person , Company và Provider là các bộ có thứ gì đó và Address ). Một cách tiếp cận khác là xác định một từ đồng nghĩa kiểu tham số.

Ví dụ: chúng ta có thể tạo Entity a :

type Entity a = (a, Address)

Để xác định một từ đồng nghĩa kiểu tham số, chúng ta phải chỉ ra tham số ở bên trái của dấu = và sử dụng nó ở bên phải. Tương tự như với các hàm.

Và bây giờ, mỗi khi chúng ta sử dụng Entity a , chúng ta có thể điều chỉnh kiểu a theo nhu cầu của mình. Ví dụ:

type Name = String
type Address = (String, Int)
type CompanyId = Int
type ProviderId = String

type Entity a = (a, Address)

bob = ("Bob Smith", ("Main St.", 555)) :: Entity Name
io = (584264, ("Cardano St.", 999)) :: Entity CompanyId
google = ("Google LLC", ("A. Parkway", 1600)) :: Entity ProviderId
other = (True, ("Some street", 0)) :: Entity Bool

Lần này, chúng ta chỉ thêm ba kiểu từ đồng nghĩa. CompanyId , ProviderId và Entity a các từ đồng nghĩa.

Và bên dưới, chúng ta có bốn giá trị khác nhau với bốn kiểu khác nhau. Tất cả chúng có được bằng cách chuyển kiểu khác cho hàm tạo cùng kiểu.

Bản thân Entity là một hàm tạo kiểu, không phải là một kiểu, vì vậy không có giá trị nào có thể có một kiểu chỉ là Entity .
Entity Name , Entity CompanyId , Entity ProviderId và Entity Bool là các kiểu hoàn toàn khác nhau!

Chúng ta cũng có thể sử dụng nhiều tham số. Ví dụ, kiểu đồng nghĩa Address cũng là một cặp. Nhưng một cái không có Address là thành phần thứ hai. Vì vậy, chúng ta có thể khái quát hóa Entity a hơn nữa và chuyển đổi hai giá trị thành các kiểu được tham số hóa:

type Name = String
type Address = Entity String Int
type CompanyId = Int
type ProviderId = String

type Entity a b = (a, b)

bob = ("Bob Smith", ("Main St.", 555)) :: Entity Name Address
io = (584264, ("Cardano St.", 999)) :: Entity CompanyId Address
google = ("Google LLC", ("A. Parkway", 1600)) :: Entity ProviderId Address
other = (True, ("Some street", 0)) :: Entity Bool Address

Như bạn có thể thấy, bây giờ Entity ab có hai tham số kiểu. Và Address là một từ đồng nghĩa với một trường hợp cụ thể của Entity ab trong đó tham số đầu tiên là String và tham số thứ hai là Int .

Tất nhiên, bây giờ cái tên Entity không có nhiều ý nghĩa và các kiểu của chúng ta bắt đầu trở nên phức tạp. Tôi chỉ muốn cho bạn thấy rằng bạn có thể sử dụng nhiều tham số kiểu và đó không phải là vấn đề lớn. Nhưng đó là khá nhiều cho các kiểu từ đồng nghĩa. Chúng rất hữu ích để cung cấp ngữ cảnh bổ sung khi cần và chúng cung cấp tính linh hoạt nhất định cho phép các tham số kiểu. Nhưng ngoài ra, chúng khá nhàm chán.

Hãy cùng tin học hay nhé! Bạn có hiểu ý tôi. Hãy cùng tìm hiểu về tham số hóa các kiểu dữ liệu!

Tham số hóa các kiểu `data`

Để thêm các tham số kiểu trong khi định nghĩa các kiểu mới, bạn làm tương tự như với hàm và các từ đồng nghĩa kiểu được tham số hóa. Thêm tham số vào bên trái của dấu = và (tùy chọn) sử dụng nó ở bên phải:

data Box a = Empty | Has a deriving (Show)

Ở đây, chúng ta đang xác định một kiểu hoàn toàn mới. Một kiểu đại diện cho một hộp chứa các giá trị.

Trong trường hợp này, Box là một hàm tạo kiểu nhận một biến kiểu a . Vì vậy, chúng ta có thể có các giá trị kiểu Box Bool , Box Char , Box Float, v.v.

Và chúng ta có hai hàm tạo giá trị:

:t Empty
:t Has

Empty khi hộp trống. Trong trường hợp này, Empty thuộc kiểu Box a , nghĩa là nó đa hình. Chúng ta không biết kiểu gì bên trong vì nó trống rỗng!

Và hàm tạo Giá trị Has khi hộp có giá trị bên trong. Trong trường hợp này, chúng ta có một giá trị bên trong, vì vậy kiểu Box a sẽ phụ thuộc vào kiểu giá trị đó.

Ví dụ:

box1 = Has "What's in the box?!"
:t box1

box2 = Empty
:t box2

Chúng ta cũng có thể sửa đổi và kết hợp các giá trị bên trong các hộp:

-- data Box a = Empty | Has a

box = Has (1 :: Int)

addN :: Num a => a -> Box a -> Box a
addN _ Empty   = Empty
addN n (Has a) = Has (a + n)

addN 3 box

Kết quả: Has 4

-- data Box a = Empty | Has a

addBoxes :: Num a => Box a -> Box a -> Box a
addBoxes _ Empty = Empty
addBoxes Empty _ = Empty
addBoxes (Has a) (Has b) = Has (a + b)

addBoxes (Has 3) (Has 7)

Kết quả:
    Has 10

addBoxes (Has 5) Empty

Kết quả:
    Empty

Và nếu chúng ta muốn trích xuất giá trị bên trong hộp thì sao? Trường hợp của hàm tạo Has a giá trị rất dễ dàng, chúng ta chỉ cần khớp mẫu và trả về a . Nhưng còn trường hợp hộp rỗng thì sao?

Chà, chúng ta có thể yêu cầu trả về một giá trị mặc định nếu hộp trống. Bằng cách đó, chúng ta luôn trả về một giá trị!

Vì vậy, nếu chúng ta dịch mã này thành mã, chúng ta nhận được:

-- data Box a = Empty | Has a

extract :: a -> Box a -> a
extract def Empty   = def
extract _   (Has x) = x

extract 'a' Empty
Kết quả:
    'a'

extract 0 (Has 15)

Kết quả:
    15

extract 0 Empty
Kết quả:
    0

extract [] (Has [1,2,3,4])
Kết quả:
    [1,2,3,4]

Chúng ta có thể tiếp tục tạo ra nhiều hàm hơn cho Box a , nhưng vẫn còn rất nhiều điều cần giải quyết, vì vậy hãy tiếp tục!

Chúng ta cũng có thể sử dụng các hàm tạo kiểu với cú pháp bản ghi. Hãy tưởng tượng chúng ta cũng muốn tùy chọn sử dụng các cách khác để thể hiện màu sắc trong hình dạng của mình. Trước đây, chúng ta đã sử dụng các giá trị String và viết ra tên của màu. Nhưng các tình huống khác có thể đảm bảo các định dạng khác nhau. Giống như giá trị thập lục phân hoặc RGB. Vì vậy, tốt hơn nếu chúng ta tham số hóa kiểu của mình như thế này:

data Shape a
  = Circle
      { position :: (Float, Float)
      , radius   :: Float
      , color    :: a
      }
  | Rectangle
      { position :: (Float, Float)
      , width    :: Float
      , height   :: Float
      , color    :: a
      }
  deriving (Show)

Bây giờ, trường màu có thể thuộc bất kỳ kiểu nào và hình dạng của chúng ta có thể thuộc kiểu Shape String , Shape Int , v.v.

Ví dụ:

circleS = Circle { position = (1,2), radius = 6, color = "Green"}
:t circleS

type RGB = (Int,Int,Int)
circleRGB = Circle { position = (1,2), radius = 6, color = (0, 128, 0) :: RGB}
:t circleRGB

Và tất cả các thuộc tính khác của các kiểu bản ghi vẫn được áp dụng.

Bây giờ chúng ta đã biết tất cả những cách tạo kiểu này, chúng ta sẽ xem xét thêm một vài ví dụ để trau dồi kiến thức. Nhưng bởi vì chúng ta là những sinh viên hiệu quả cao, chúng ta sẽ ném một mũi tên trúng hai đích và học về đệ quy khi học môn này!

Kiểu data đệ quy

Chúng ta có thể sử dụng các kiểu từ đồng nghĩa bên trong các kiểu từ đồng nghĩa khác. Nhưng vì lý do kỹ thuật, chúng ta không thể định nghĩa các kiểu từ đồng nghĩa đệ quy. Tuy nhiên, chúng ta có thể định nghĩa các kiểu dữ liệu đệ quy.

Tweet cho tôi một dòng sông

Đây là tình hình. Elon Musk muốn xây dựng lại Twitter bằng Haskell. Và bạn đang phỏng vấn cho vị trí này. Câu hỏi đầu tiên là xác định kiểu dữ liệu cho một tweet. Một tweet có nội dung của nó, số lượt retweet, lượt thích, bình luận, siêu dữ liệu, v.v. Đó sẽ là một kiểu dữ liệu khổng lồ, nhưng người phỏng vấn không quan tâm đến các chi tiết. Anh ấy muốn bạn trình bày ý tưởng chung.

Vì vậy, bạn cung cấp điều này:

data Tweet = Tweet
  { contents :: String
  , likes :: Int
  , comments :: [Tweet]
  }deriving (Show)
:t Tweet -- Type of the Tweet constructor

Chỉ cần 1 hàm tạo với 3 trường. Bạn đã sử dụng cú pháp bản ghi vì bạn biết kiểu này cuối cùng sẽ chứa nhiều trường hơn và sẽ rất cồng kềnh nếu sử dụng cú pháp thông thường. Bạn cũng nhận ra rằng một nhận xét cho một tweet chỉ là một tweet khác, vì vậy bạn có thể sử dụng đệ quy [Tweet] làm kiểu nhận xét bên trong kiểu dữ liệu Tweet .

Và để kiểm tra, bạn tạo một giá trị Tweet thực tế:

tweet :: Tweet
tweet = Tweet "I'm angry about something! >.<" 5
    [ Tweet "Me too!" 0 []
    , Tweet "It makes me angry that you're angry" 2
        [ Tweet "I have no idea what's happening" 3 [] ]
    ]

Người phỏng vấn thích ý tưởng của bạn nhưng lại hoài nghi về việc làm việc với một kiểu như thế này sẽ dễ dàng như thế nào. Và để chứng minh rằng điều đó cực kỳ dễ dàng, bạn đã viết một hàm để đo lường mức độ tương tác dựa trên số lượt thích và phản hồi của tweet và tất cả các tweet mà tweet đó tạo ra có:

engagement :: Tweet -> Int
engagement Tweet {likes = l, comments = c} = l + length c + sum (map engagement c)

engagement tweet

Kết quả: 13

Mẫu hàm engagement chỉ khớp với các trường nó cần, sau đó nó thêm lượt thích và lượng bình luận của tweet đó. Và cùng với đó, nó đã thêm tổng các số được tạo bằng cách ánh xạ đệ quy hàm engagement mà chúng ta đang tạo cho tất cả các tweet trong danh sách nhận xét.

Người phỏng vấn ấn tượng đến mức cô ấy dừng cuộc phỏng vấn trong thời gian ngắn và đề nghị cho bạn một vị trí cấp cao. Nhưng bạn đã từ chối lời đề nghị khi biết rằng hiện tại, lương của tất cả nhân viên Twitter được trả bằng Dodge coin.

Vì vậy, bạn chuyển sang cuộc phiêu lưu tiếp theo.

Một `Sequence` của `Nodes`

Sau khi hoàn thành thành công quy trình phỏng vấn của Twitter và từ chối lời đề nghị của họ, sự tự tin của bạn tăng vọt và bạn quyết định thử việc tại Google.

Các cuộc phỏng vấn ban đầu đều ổn, nhưng đã đến lúc thực sự: Cuộc phỏng vấn kỹ thuật! Bạn xuất hiện đúng giờ và người phỏng vấn cũng vậy. Chúng ta đang chuẩn bị cho một khởi đầu tốt. Và đây là câu hỏi đầu tiên:

"Viết kiểu dữ liệu đại diện cho một chuỗi nút tuyến tính trong đó mỗi nút chứa một giá trị và trỏ đến phần còn lại của chuỗi."

Vừa đủ dễ! Vì vậy, bạn cần một kiểu dữ liệu tương tự như Box a mà chúng ta đã tạo trước đó:

data Box a = Empty | Has a

Hàm tạo Empty đại diện cho một nút trống và hàm tạo Has là một nút có giá trị bên trong. Đó là một khởi đầu tốt. Vấn đề là bạn cần chứa một chuỗi các hộp này.

May mắn thay, bạn biết rằng bạn có thể truyền nhiều tham số cho một hàm tạo giá trị, vì vậy bạn có thể chỉ cần thêm một hộp khác làm tham số thứ hai của hàm tạo Has :

data Box a = Empty | Has a (Box a)

:t Has

Tham số mới đó có nghĩa là hàm tạo Giá trị Has hiện chứa một giá trị và một hộp có thể chứa một giá trị khác và một hộp khác, v.v.

Và với điều đó, bùng nổ! Chúng ta có một kiểu dữ liệu là một chuỗi tuyến tính của các hộp (hoặc các nút) trong đó mỗi hộp có một giá trị và trỏ đến phần còn lại của các hộp.

Và điều đó thật tuyệt vời! Nhưng bạn đã làm tất cả những điều này trong đầu, và người phỏng vấn bắt đầu lo lắng về sự im lặng kéo dài của bạn. Vì vậy, bạn đã giải thích lý do nhưng thay đổi từ "Box" bằng "Sequende" và "Has" bằng "Node" vì đó là ngôn ngữ của câu hỏi. Vì vậy, bạn đã trình bày giải pháp như thế này:

data Sequence a = EmptyS | Node a (Sequence a) deriving (Show)

:t Node

Kiểu dữ liệu đó đại diện cho một chuỗi các nút có thể trống hoặc có một nút chứa giá trị và trỏ đến phần còn lại của chuỗi. Nó vẫn giống như trước đây, nhưng việc thay đổi tên khiến bạn nghĩ khác về những gì đang xảy ra.

Và để chứng minh rằng nó hoạt động như mong đợi, bạn tạo một vài giá trị:

-- data Sequence a = EmptyS | Node a (Sequence a)

sequence1 :: Sequence a
sequence1 = EmptyS -- A sequence of just one empty node

sequence2 :: Sequence Char
sequence2 = Node 'a' EmptyS -- A sequence of 2 nodes

sequence3 :: Sequence Bool
sequence3 = Node True (Node False EmptyS) -- A sequence of 3 nodes

sequence4 :: Sequence Integer
sequence4 = Node 1 (Node 2 (Node 3 EmptyS)) -- A sequence of 4 nodes

Ngay sau đó, người phỏng vấn nhìn thẳng vào mắt bạn và hỏi:

"Và điều này hữu ích như thế nào?"

Bạn do dự trong một giây. Và đó là khi bạn mơ hồ nhớ đến một khóa học Haskell mà bạn đã học từ lâu---vâng, các bài giảng video cũng có thể được đệ quy. Bạn mỉm cười và nói: "Ồ, tôi sẽ cho bạn biết điều này hữu ích như thế nào."

Và tiến hành sửa đổi một chút kiểu dữ liệu để tạo điểm nhấn. Đây là những gì bạn đã làm:

infixr 5 :->
data Sequence a = EmptyS | a :-> (Sequence a) deriving (Show)

:t (:->)

Vì các hàm tạo giá trị chỉ là các hàm, nên bạn cũng có thể tạo các hàm tạo giá trị trung tố---với lưu ý rằng chúng phải bắt đầu bằng dấu hai chấm ( : ).

Trong trường hợp này, bạn xác định hàm tạo giá trị :-> (mũi tên lạ) lấy giá trị của nút làm đối số đầu tiên và phần còn lại của chuỗi làm đối số thứ hai.

Vì vậy, giá trị sequence4 trước đó bây giờ trông như thế này:

sequence4 :: Sequence Integer
sequence4 = 1 :-> 2 :-> 3 :-> EmptyS -- A sequence of 3 nodes + empty node

Trông quen quen? Chính xác! Đó là một danh sách!! Nếu chúng ta so sánh hai bên cạnh nhau, điều đó khá rõ ràng:

{.cell .code

sequence4' :: [] Integer     -- Same as [Integer]
sequence4' = 1 : 2 : 3 : []  -- A list with 3 elements + empty list

Và nếu chúng ta so sánh kiểu của chúng ta với cách các danh sách được định nghĩa trong Haskell:

data Sequence a = EmptyS | a :-> (Sequence a)

data []       a = []     | a :   [a]

Chúng ta thấy rằng chúng gần như cùng kiểu, nhưng các danh sách có một số cú pháp đặc biệt "thêm đường" để làm cho chúng dễ sử dụng hơn.

Và đó là lý do tại sao bạn chọn fixity là infixr 5 . Bởi vì nó giống như : constructor.

Sau khi trình bày bằng chứng đó, tiện ích của kiểu này là rõ ràng. Bạn vừa tạo lại kiểu danh sách và danh sách ở khắp mọi nơi!

Người phỏng vấn hài lòng, nhưng anh ấy chỉ mới bắt đầu! Và anh hỏi:

"Bây giờ hãy viết một hàm để kiểm tra xem một phần tử cụ thể có nằm trong chuỗi này hay không."

Người phỏng vấn hài lòng, nhưng anh ấy chỉ mới bắt đầu! Và anh hỏi:

Không có gì! Bạn phải triển khai hàm elem cho kiểu mới của mình giống như cách nó được triển khai cho danh sách:

-- data Sequence a = EmptyS | a :-> (Sequence a)

elemSeq :: (Eq a) => a -> Sequence a -> Bool
elemSeq _ EmptyS = False
elemSeq x (y :-> ys) = x == y || elemSeq x ys

Bạn xác định hàm elemSeq nhận giá trị kiểu a và giá trị kiểu Sequence a và trả về Bool . Trong đó a là một thể hiện của kiểu đẳng thức (vì bạn sẽ kiểm tra đẳng thức).

Bạn có hai hàm tạo, vì vậy bạn bắt đầu với hai phương trình. Một cho hàm tạo EmptyS và một cho hàm tạo :-> .

Nếu dãy trống, bạn không quan tâm đến giá trị khác vì bạn biết nó sẽ không nằm trong một nút trống. Và nếu chuỗi có ít nhất một nút không trống, bạn sẽ so khớp mẫu để trích xuất giá trị của nút đầu tiên ( y ), kiểm tra xem giá trị đó có bằng với giá trị được cung cấp dưới dạng tham số đầu tiên không ( x ) và áp dụng đệ quy hàm elemSeq đến cùng một giá trị ban đầu và phần còn lại của danh sách.

Nếu ít nhất một phần tử của danh sách bằng với giá trị được cung cấp, bạn muốn trả về True . Vì vậy, bạn sử dụng || toán tử nhận hai boolean và trả về True nếu một trong hai giá trị là True . Bằng cách đó, ngay khi bạn nhận được một trận đấu, bạn sẽ nhận được True cho đến cuối cùng. Và bạn sẽ biết giá trị đó nằm trong dãy.

Sử dụng hàm này, chúng ta có thể kiểm tra xem một phần tử có nằm trong chuỗi các nút của chúng ta hay không như thế này:

seq5 = 'a' :-> 'b' :-> '4' :-> '%' :-> EmptyS

elemSeq 'c' seq5
Kết quả:
    False

elemSeq '%' seq5
Kết quả:
    True

"Làm tốt." - người phỏng vấn nói - "Nhưng tôi có một vấn đề với điều này. Tôi có hàng chục nghìn phần tử, và nếu chúng ta phải kiểm tra từng phần tử một theo trình tự, thì sẽ mất rất nhiều thời gian!"

Bạn đã thấy điều này đến từ cách xa một dặm và nói: "Không thành vấn đề! Nếu chúng ta có các giá trị được sắp xếp theo thứ tự, chúng ta có thể sử dụng Cây tìm kiếm nhị phân!"

`Tree` `Nodes`

Người phỏng vấn đã đúng! Hãy tưởng tượng bạn có 10.000 mục để xem qua. Nếu bạn đi từng người một, nó sẽ mất mãi mãi! Vậy bạn làm gì? Hãy nghĩ về lần cuối cùng bạn tìm kiếm một từ trong từ điển. Không, không phải trên máy tính. Tôi có nghĩa là một từ điển vật lý thực tế. Bạn đã làm nó như thế nào? Bạn có đi đến trang đầu tiên, tìm từ ở đó, sau đó đến trang thứ hai, v.v.? KHÔNG! Bạn thẳng lên mở từ điển ở giữa! Và khi bạn thấy rằng từ đó không có ở đó, bạn đã chọn một trong các nửa dựa trên thứ tự của bảng chữ cái, chia đôi nửa đó và kiểm tra lại từ đó. Bằng cách đó, mỗi lần bạn kiểm tra, bạn đã giảm được một nửa kích thước của vấn đề. Đó được gọi là "thuật toán tìm kiếm nhị phân" và nó tốt hơn nhiều so với tìm kiếm tuyến tính. Bạn hỏi tốt hơn bao nhiêu?

Ví dụ: nếu từ điển có 10.000 trang, khi tìm kiếm theo tuyến tính, trường hợp xấu nhất (từ ở cuối) sẽ là tra tất cả 10.000 trang. Nhưng nếu chúng ta sử dụng thuật toán tìm kiếm nhị phân, trường hợp xấu nhất là chúng ta cần kiểm tra 13 trang! 13! Đó là nó! Bạn có thể thấy đây là một công cụ thay đổi cuộc chơi về hiệu quả như thế nào.

Vì vậy, chúng ta muốn tạo một cấu trúc dữ liệu cho phép chúng ta dễ dàng tìm kiếm theo cách đó. Có một vài chúng ta có thể sử dụng. Nhưng một trong những cấu trúc nổi tiếng nhất là cấu trúc dữ liệu Cây tìm kiếm nhị phân (còn gọi là Cây nhị phân được sắp xếp). Và nó trông như thế này:

Trong một cây nhị phân:

Mỗi nút có thể có nhiều nhất hai nút con
Nó chỉ có một gốc, nghĩa là một nút không có nút cha (trong trường hợp này là nút 8).
Và chỉ có một đường dẫn để đến bất kỳ nút nào.

Vì vậy, nút có giá trị 3 là con của nút 8 và nút cha của nút 1 và 6. Và cách duy nhất để đến nút 7 là đi qua 8, 3, 6 và 7.

Đó là một cây nhị phân. Bây giờ, điều khiến "Cây nhị phân" này trở thành "Cây tìm kiếm nhị phân" là giá trị của mỗi nút lớn hơn tất cả các giá trị bên dưới cây con bên trái của nút và nhỏ hơn giá trị bên dưới cây con bên phải của nó. Ví dụ: tất cả các giá trị bên dưới cây con bên trái của nút 8 đều nhỏ hơn 8 và tất cả các giá trị bên dưới cây con bên phải của nút 8 đều lớn hơn 8.

Khi biết điều này, mỗi lần chúng ta kiểm tra giá trị của một nút và đó không phải là nút chúng ta đang tìm kiếm, chúng ta biết rằng nếu giá trị nhỏ hơn, chúng ta phải tiếp tục tìm trên cây con bên trái và nếu nó lớn hơn, chúng ta phải tiếp tục đi trên cây con bên phải. Cho phép chúng ta kiểu bỏ tất cả các nút của nhánh khác và giảm một nửa kích thước của vấn đề. Giống như chúng ta đã làm trong ví dụ về từ điển.

Ok, vậy làm thế nào để chúng ta dịch mã này thành mã? Chà, Haskell làm cho nó dễ dàng một cách đáng ngạc nhiên.

data Sequence a = EmptyS | Node a (Sequence a) deriving (Show)

Trong kiểu Sequence a của chúng ta, chúng ta có một trường hợp trong đó nút trống và một trường hợp khi nút có giá trị và được trỏ đến phần còn lại của chuỗi.

Để tạo một BST, chúng ta hầu như cần cùng một kiểu, ngoại trừ việc bây giờ chúng ta muốn chúng trỏ tới tối đa hai trình tự hiện là cây. Vì vậy, kiểu dữ liệu chúng ta cần là kiểu này:

"19"

data Tree a = EmptyT | Node a (Tree a) (Tree a) deriving (Show)

:t Node

Và thế là xong! Sự khác biệt duy nhất nằm ở hàm tạo Node , hiện chứa một giá trị và hai cây con khác nhau.

Hãy trồng một vài cây:

"20"

-- data Tree a = EmptyT | Node a (Tree a) (Tree a)

emptyTree :: Tree a
emptyTree = EmptyT

oneLevelTree :: Tree Char
oneLevelTree = Node 'a' EmptyT EmptyT

twoLevelTree :: Tree Integer
twoLevelTree = Node 8
  (Node 3  EmptyT EmptyT)
  (Node 10 EmptyT EmptyT)

threeLevelTree :: Tree Integer -- Almost the same as the tree of the image threeLevelTree = Node 8
  (Node 3
    (Node 1 EmptyT EmptyT)
    (Node 6 EmptyT EmptyT)
  )
  (Node 10
    EmptyT
    (Node 14 EmptyT EmptyT)
  )

Tuyệt vời. Chúng ta có kiểu dữ liệu của chúng ta đã sẵn sàng để khuấy động! Bây giờ chúng ta cần triển khai hàm để kiểm tra xem một phần tử có nằm trong cây hay không.

Chúng ta bắt đầu, như mọi khi, với kiểu. Hàm sẽ lấy một giá trị kiểu a và một cây giá trị kiểu a . Nó sẽ kiểm tra xem giá trị có nằm trong cây hay không và trả về Bool giá trị True nếu đúng và False nếu không. Vì vậy, chúng ta có thể bắt đầu với một chữ ký kiểu như thế này:

elemTree :: a -> Tree a -> Bool

Bây giờ, vì kiểu Tree có hai hàm tạo, nên chúng ta biết rằng có khả năng chúng ta sẽ cần hai định nghĩa (một định nghĩa cho mỗi hàm tạo) cho hai trường hợp. Một khi cây trống và một khi cây không có:

elemTree :: a -> Tree a -> Bool
elemTree v EmptyT = False
elemTree v (Node x left right) = ...

Nếu cây trống, giá trị chúng ta cung cấp rõ ràng không có trong cây, vì vậy chúng ta trả về False .

Và nếu cây không trống thì sao? Chà, chúng ta chỉ khớp mẫu với nút và có giá trị của nó ngay tại đó. Cũng có thể kiểm tra xem đó có phải là thứ chúng ta cần không:

elemTree :: (Eq a) => a -> Tree a -> Bool
elemTree v EmptyT = False
elemTree v (Node x left right) = if v == x then True else ...

Bởi vì chúng ta đang kiểm tra xem giá trị của tham số đầu tiên có bằng giá trị bên trong cây hay không, nên chúng ta biết kiểu a phải là một thể hiện của lớp kiểu Eq . Vì vậy, chúng ta thêm ràng buộc đó vào chữ ký.

Nếu bằng ta trả về True và kết thúc câu chuyện. Nhưng nếu không, chúng ta phải chọn cây con để tiếp tục tìm kiếm. Và điều đó phụ thuộc vào việc giá trị lớn hơn hay nhỏ hơn giá trị trong nút. Vì vậy, chúng ta không chỉ phải kiểm tra xem giá trị có bằng nhau hay không mà còn lớn hơn hoặc nhỏ hơn giá trị của nút.

elemTree :: (Ord a) => a -> Tree a -> Bool
elemTree v EmptyT = False
elemTree v (Node x left right)
    | v == x = True
    | v > x  = ...
    | v < x  = ...

Bởi vì bây giờ chúng ta cũng phải sử dụng các hành vi > (lớn hơn) và < (nhỏ hơn), nên các kiểu phải là một thể hiện của lớp kiểu Ord . Và bởi vì (như chúng ta đã thấy trong bài học trước) để trở thành một thể hiện của lớp kiểu Ord , trước đây bạn phải là một thể hiện của lớp kiểu Eq , chúng ta có thể kiểu bỏ ràng buộc đó và đặt ràng buộc Ord .

Ngoài ra, bởi vì chúng ta cần một loạt các câu lệnh if-else lồng nhau, chúng ta chuyển sang các bộ bảo vệ để có mã đơn giản hơn. Và bây giờ cho hai trường hợp cuối cùng:

elemTree :: (Ord a) => a -> Tree a -> Bool
elemTree v EmptyT = False
elemTree v (Node x left right)
    | v == x = True
    | v > x  = elemTree v right
    | v < x  = elemTree v left
-- Examples
elemTree 6 threeLevelTree
elemTree 17 threeLevelTree

Kết quả: Đúng

Kết quả: Sai

Nếu giá trị được cung cấp lớn hơn giá trị của nút, chúng ta biết rằng---nếu giá trị nằm trong cây---thì nó sẽ nằm trong nhánh bên phải, nơi tất cả các giá trị đều lớn hơn giá trị của nút hiện tại . Vì vậy, điều duy nhất chúng ta phải làm là kiểm tra đệ quy đúng cây con có cùng giá trị ban đầu.

Và nếu giá trị nhỏ hơn giá trị của nút, chúng ta biết rằng---nếu giá trị ở trong cây---thì nó sẽ ở nhánh bên trái, nơi tất cả các giá trị đều nhỏ hơn giá trị của nút hiện tại . Vì vậy, điều duy nhất chúng ta phải làm là kiểm tra đệ quy cây con bên trái với cùng một giá trị ban đầu.

Và thế là xong! Chúng ta có một cách để kiểm tra xem một giá trị có trong cấu trúc dữ liệu của chúng ta hay không bằng cách sử dụng thuật toán tìm kiếm nhị phân.

Đó là một giải pháp tuyệt vời. Vấn đề là, trong khi bạn đang suy nghĩ về tất cả những điều này, bạn đã quá tập trung vào những suy nghĩ của mình đến nỗi bạn không hề nhận ra rằng đã 15 phút trôi qua mà bạn không nói gì! Người phỏng vấn có một chút sợ hãi và nói với bạn rằng thật tuyệt khi được gặp bạn và họ sẽ liên lạc để thông báo cho bạn biết nếu bạn vượt qua cuộc phỏng vấn.

Vì vậy, điều rút ra là, trong cuộc phỏng vấn tiếp theo của bạn, hãy nhớ suy nghĩ thấu đáo trong khi giải quyết các vấn đề. Nó giúp người phỏng vấn biết quá trình suy nghĩ của bạn và bạn tránh thể hiện khuôn mặt của mình khi xem say sưa các video Haskell. Vâng, một trong những bạn đang thực hiện ngay bây giờ.

Nhưng đừng lo, bạn sẽ có nhiều cơ hội giả định hơn. Hiện tại, chúng ta vẫn còn một vài điều nữa để xem ngày hôm nay. Ví dụ, thực tế là hình dạng của kiểu dữ liệu chỉ đạo cách bạn viết các hàm với nó.

Hình dạng của kiểu dữ liệu chỉ đạo cách bạn viết các hàm với nó

Bây giờ, điều này không được viết bằng đá, nhưng nói chung, bạn có một phương trình cho mỗi hàm tạo giá trị. Và nếu một hàm tạo là đệ quy (một hoặc N lần), thì phương trình sẽ được đệ quy (một hoặc N lần).

Một vài ví dụ là:

"2"

-- data Box a = Empty | Has a

extract :: a -> Box a -> a
extract def Empty   = def
extract _   (Has x) = x

Kiểu dữ liệu Box a có hai hàm tạo ( Empty và Has ) và không có hàm tạo nào là đệ quy.

Vì vậy, khi bạn viết một hàm cho kiểu dữ liệu này, có thể bạn sẽ cần viết hai công thức (có nghĩa là hai định nghĩa)---một công thức cho mỗi hàm tạo---và sẽ không có công thức nào có lệnh gọi đệ quy.

-- data Sequence a = EmptyS | a :-> (Sequence a)

elemSeq :: (Eq a) => a -> Sequence a -> Bool
elemSeq _ EmptyS = False
elemSeq x (y :-> ys) = x == y || elemSeq x ys

Kiểu dữ liệu Sequence a có hai hàm tạo ( EmptyS và :-> ) và một trong các hàm tạo ( :-> ) là đệ quy (có (Sequence a ) làm tham số thứ hai).

Vì vậy, khi bạn viết một hàm cho kiểu dữ liệu này, có thể bạn sẽ cần viết hai công thức---một công thức cho mỗi hàm tạo---và công thức phù hợp với hàm tạo :-> sẽ có lệnh gọi hàm đệ quy bạn đang xác định.

"6"

-- data Tree a = EmptyT | Node a (Tree a) (Tree a)

elemTree :: (Ord a) => a -> Tree a -> Bool
elemTree v EmptyT = False
elemTree v (Node x left right)
    | v == x = True
    | v > x  = elemTree v right
    | v < x  = elemTree v left

Kiểu dữ liệu Tree a có hai hàm tạo ( EmptyT và Node ) và một trong các hàm tạo ( Node ) là đệ quy hai lần ( (Tree a ) hai lần).

Vì vậy, khi bạn viết một hàm cho kiểu dữ liệu này, có thể bạn sẽ cần viết hai công thức---một công thức cho mỗi hàm tạo---và công thức phù hợp với hàm tạo Node sẽ có hai lệnh gọi đệ quy của hàm mà bạn đang xác định.

Tất nhiên, có những trường hợp khi quy tắc ngón tay cái này không được áp dụng. nhưng bạn có thể sử dụng nó để bắt đầu bất cứ khi nào bạn không chắc về cách xác định hàm.

Như bạn có thể thấy, có quá nhiều thứ đang diễn ra với các kiểu, hàm tạo giá trị, hàm tạo kiểu, v.v. nên thật khó để theo dõi mọi thứ. Rất may, Haskell có một mánh khóe: Kinds !

Kinds

Hãy quay trở lại những ngày đơn giản hơn. Ghi nhớ các kiểu Box ? KHÔNG? Xem nào.. nó có một hàm tạo giá trị được gọi là Has . Hãy kiểm tra kiểu của nó:

:t Has

Thật tuyệt, vì vậy nó nhận một giá trị thuộc bất kỳ kiểu nào và trả về một giá trị thuộc kiểu Box a . Và chuyện gì xảy ra với kiểu Box đó? Làm thế nào tôi có thể biết thêm về nó? Nếu bạn cố kiểm tra kiểu của một kiểu, bạn sẽ gặp lỗi:

:t Box

Nhưng có một cách để biết thêm về kiểu đó. Chúng ta có thể sử dụng lệnh :i (info):

:i Box

Dòng thứ hai là định nghĩa. Nhưng những ngôi sao ở dòng đầu tiên là cái quái gì vậy? Đó là kiểu của Box . Tương tự như cách kiểu của hàm tạo giá trị cung cấp cho bạn số lượng và kiểu giá trị mà nó nhận, kiểu của hàm tạo kiểu cung cấp cho bạn số lượng và kiểu mà hàm tạo đó nhận.

Hãy để tôi nói rằng một lần nữa:

Loại của hàm tạo giá trị cung cấp cho bạn số lượng và kiểu giá trị mà nó nhận.

                          |
                          v

Loại của hàm tạo kiểu cung cấp cho bạn số lượng và kiểu kiểu cần thiết.

Vì vậy, một kiểu giống như kiểu của một kiểu .

Bạn có thể đọc các kiểu như thế này:

* có nghĩa là: "kiểu bê tông" (một kiểu không có bất kỳ tham số nào. Giống như Float .)
* -> * có nghĩa là: "hàm tạo kiểu lấy một kiểu cụ thể và trả về một kiểu cụ thể khác" (Giống như Box a .)
* -> (* -> *) -> * có nghĩa là: "hàm tạo kiểu nhận một kiểu cụ thể và một hàm tạo kiểu tham số đơn và trả về một kiểu cụ thể" (chúng ta chưa thấy một trong số này.)
Và như thế...

Một vài ví dụ:

Int , String và các kiểu khác giống như chúng là các kiểu cụ thể.

-- Concrete types

:k Int
:k String
:k Bool

Như bạn có thể thấy, bạn cũng có thể kiểm tra kiểu của một kiểu bằng cách sử dụng lệnh :k ( :kind ).

Box , Sequence và Tree đều lấy một kiểu cụ thể ( String , Int , không quan trọng) và trả về một kiểu cụ thể ( Box Int , Sequence String , Tree Float ).

-- Type constructor with one concrete type as parameter

:k Box
:k Sequence
:k Tree

Từ đồng nghĩa kiểu Entity lấy hai kiểu cụ thể và trả về một kiểu cụ thể ( Entity String Bool ).

-- Type constructor with two concrete types as parameters
-- type Entity a b = (a, b)

:k Entity

Như bạn có thể thấy, gõ từ đồng nghĩa cũng có các kiểu. Bởi vì chúng cũng có thể có các tham số kiểu.

Ngoài ra, hãy lưu ý rằng ngay khi một hàm tạo kiểu nhận được tất cả các tham số của nó, nó sẽ trở thành một kiểu cụ thể:

:k Box
:k Box String

Và rằng bạn cũng có thể áp dụng một phần các hàm tạo kiểu, giống như với các hàm hoặc hàm tạo giá trị!:

data DoubleBox a b = Empty | Has a b deriving (Show)

:k DoubleBox
:k DoubleBox String
:k DoubleBox String Int

Vì vậy, lần tới khi bạn cần biết thêm một chút về hàm tạo kiểu, hãy kiểm tra kiểu của nó!

Và bây giờ, để kết thúc bài giảng, tôi sẽ cung cấp cho bạn thêm một thông tin nhỏ xíu nữa. Nhưng đừng lo lắng. Bạn không cần phải học bất cứ điều gì hơn là một lời cảnh báo và một từ khóa duy nhất. Và đó là từ khóa newType .

Từ khóa `newType`

newType về cơ bản hoạt động giống như từ khóa data , ngoại trừ một lưu ý quan trọng:

Các kiểu được tạo bằng newType cần phải có chính xác một hàm tạo với chính xác một tham số/trường .

-- Like this:
newtype Color a = Color a
-- And this:
newtype Product a = Product { getProduct :: a }

Tuy nhiên, bạn cũng có thể làm điều đó với data . Vì vậy, tại sao lại sử dụng newType ?

Phiên bản ngắn: Lý do hiệu suất. Vì vậy, nếu bạn tình newtype tạo một kiểu dữ liệu với một hàm tạo và một tham số, bạn có thể chuyển từ khóa data sang kiểu mới và được tăng hiệu suất miễn phí.

9-Tạo kiểu tham số và đệ quy

Outline​

Các kiểu tham số​

Tham số hóa kiểu từ đồng nghĩa​

Tham số hóa các kiểu data​

Kiểu data đệ quy​

Tweet cho tôi một dòng sông​

Một Sequence của Nodes​

Tree Nodes​

Hình dạng của kiểu dữ liệu chỉ đạo cách bạn viết các hàm với nó​

Kinds​

Từ khóa newType​