알고리즘/Heap 힙

[프로그래머스] 디스크 컨트롤러 - 파이썬(python)

아뵹젼 2022. 9. 4.

문제 설명

하드디스크는 한 번에 하나의 작업만 수행할 수 있습니다. 디스크 컨트롤러를 구현하는 방법은 여러 가지가 있습니다. 가장 일반적인 방법은 요청이 들어온 순서대로 처리하는 것입니다.

예를들어

- 0ms 시점에 3ms가 소요되는 A작업 요청
- 1ms 시점에 9ms가 소요되는 B작업 요청
- 2ms 시점에 6ms가 소요되는 C작업 요청

와 같은 요청이 들어왔습니다. 이를 그림으로 표현하면 아래와 같습니다.

한 번에 하나의 요청만을 수행할 수 있기 때문에 각각의 작업을 요청받은 순서대로 처리하면 다음과 같이 처리 됩니다.

- A: 3ms 시점에 작업 완료 (요청에서 종료까지 : 3ms)
- B: 1ms부터 대기하다가, 3ms 시점에 작업을 시작해서 12ms 시점에 작업 완료(요청에서 종료까지 : 11ms)
- C: 2ms부터 대기하다가, 12ms 시점에 작업을 시작해서 18ms 시점에 작업 완료(요청에서 종료까지 : 16ms)

이 때 각 작업의 요청부터 종료까지 걸린 시간의 평균은 10ms(= (3 + 11 + 16) / 3)가 됩니다.

하지만 A → C → B 순서대로 처리하면

- A: 3ms 시점에 작업 완료(요청에서 종료까지 : 3ms)
- C: 2ms부터 대기하다가, 3ms 시점에 작업을 시작해서 9ms 시점에 작업 완료(요청에서 종료까지 : 7ms)
- B: 1ms부터 대기하다가, 9ms 시점에 작업을 시작해서 18ms 시점에 작업 완료(요청에서 종료까지 : 17ms)

이렇게 A → C → B의 순서로 처리하면 각 작업의 요청부터 종료까지 걸린 시간의 평균은 9ms(= (3 + 7 + 17) / 3)가 됩니다.

각 작업에 대해 [작업이 요청되는 시점, 작업의 소요시간]을 담은 2차원 배열 jobs가 매개변수로 주어질 때, 작업의 요청부터 종료까지 걸린 시간의 평균을 가장 줄이는 방법으로 처리하면 평균이 얼마가 되는지 return 하도록 solution 함수를 작성해주세요. (단, 소수점 이하의 수는 버립니다)

제한 사항
  • jobs의 길이는 1 이상 500 이하입니다.
  • jobs의 각 행은 하나의 작업에 대한 [작업이 요청되는 시점, 작업의 소요시간] 입니다.
  • 각 작업에 대해 작업이 요청되는 시간은 0 이상 1,000 이하입니다.
  • 각 작업에 대해 작업의 소요시간은 1 이상 1,000 이하입니다.
  • 하드디스크가 작업을 수행하고 있지 않을 때에는 먼저 요청이 들어온 작업부터 처리합니다.
입출력 예
jobs return
[[0, 3], [1, 9], [2, 6]] 9
입출력 예 설명

문제에 주어진 예와 같습니다.

  • 0ms 시점에 3ms 걸리는 작업 요청이 들어옵니다.
  • 1ms 시점에 9ms 걸리는 작업 요청이 들어옵니다.
  • 2ms 시점에 6ms 걸리는 작업 요청이 들어옵니다.
출처: https://school.programmers.co.kr/learn/courses/30/lessons/42627#

 

 
 

나의 풀이

from heapq import heappush, heappop

def solution(jobs):
    jobs.sort()
    num = len(jobs)
    waiting = [] # (소요시간, 요청시점)
    count = [] # 각 작업이 몇초 걸렸는지
    now = 0 #현재 시각

    while len(count) != num : 
        while jobs and now >= jobs[0][0] : 
            top = jobs.pop(0)
            heappush(waiting, (top[1], top[0]))

        if jobs and waiting == []:
            top = jobs.pop(0)
            now = top[0]
            heappush(waiting, (top[1], top[0]))
  

        x,y = heappop(waiting)
        now += x 
        count.append(now-y)

    return sum(count)//num

 

 

step 1

  • input 으로 들어오는 jobs 를 요청시각을 기준으로 오름차순으로 정렬하였다.
  • 각 작업이 요청부터 종료까지 걸린 시간을 count 라는 리스트에 저장한다. 
  • 현재 시각을 나타내는 now 변수를 두었으며, 작업의 개수를 뜻하는 num 변수를 두었다.
  • waiting 은 현재 대기하고 있는 작업을 담고 있는 리스트이다. 즉, 작업의 요청시각이 now 이전이라면, 해당 작업은 대기리스트에 담길 수 없다.

 

step 2

  • while len(count) != num : 
  • 작업의 개수만큼 count 리스트가 채워졌다면, 모든 작업이 종료됨을 뜻하므로 반복문을 탈출한다.

 

  • while jobs and now >= jobs[0][0] : 
                top = jobs.pop(0)
                heappush(waiting, (top[1], top[0]))
  • jobs 에는 요청 시점이 빠른 순서대로 작업들이 담겨있다.
  • 따라서 가장 앞에 있는 작업이 현재 시각(now) 이전에 요청된 것이라면, 대기 리스트에 추가한다.
  • 즉, 요청 시각이 현재 이전인 모든 작업을 대기 리스트에 담는 코드이다.

 

  • if jobs and waiting == []:
                top = jobs.pop(0)
                now = top[0]
                heappush(waiting, (top[1], top[0]))
  • 만약 jobs 가 존재하는데, 대기리스트가 비어있다면 이전의 코드에서 대기 리스트에 담긴 작업이 없다는 뜻이다.
  • 즉, 현재 시각보다 요청시간이 늦은 작업들만 남아 있는 것이다.
  • 따라서 jobs에서 하나의 작업을 꺼낸 후 현재 시각을 해당 작업의 요청시각으로 변경한다.
  • 이때, 작업에 소요되는 시간을 기준으로 최소힙에 push 하기 위해서, (소요시간, 요청시각) 의 튜플을 heappush 한다.

 

  •  x,y = heappop(waiting)
            now += x 
            count.append(now-y)
  • 이제 작업을 수행하는 코드이다.
  • 최소 힙으로 구현된 대기 리스트에 있는 작업들 중, 0번째 작업은 소요시간이 가장 적게 걸리는 작업이다.
  • 작업을 완료한 후에 현재 시각에 작업의 소요시간을 더한다.
  • 그리고, 작업이 요청부터 종료까지 걸린 시간을 count 리스트에 추가하기 위해서, 현재 시각 - 요청시각을 계산한 변수를 추가한다.

 

  •  return sum(count)//num
  • 모든 작업이 끝났으며, 작업 요청시각~종료 까지의 평균 시간을 return 한다.

 

 

다른 풀이

import heapq

def solution(jobs):
	# 요청시각이 빠른 순서대로 정렬하며, 요청시각이 같을 경우에는 소요시간이 적게 걸리는 순서대로 정렬한다.
    tasks = sorted([(x[1], x[0]) for x in jobs],
                   key=lambda x: (x[1], x[0]), reverse=True)
    q = []
    heapq.heappush(q, tasks.pop())
    current_time, total_response_time = 0, 0
   
   # 큐(대기리스트) 에 남아있는 작업이 있을 때까지 반복문을 실행한다.
    while len(q) > 0:
        dur, arr = heapq.heappop(q) # dur은 작업 소요시간, arr은 작업 요청시각
        current_time = max(current_time + dur, arr + dur)
        total_response_time += current_time - arr
        while len(tasks) > 0 and tasks[-1][1] <= current_time:
            heapq.heappush(q, tasks.pop())
        if len(tasks) > 0 and len(q) == 0:
            heapq.heappush(q, tasks.pop())
    return total_response_time // len(jobs)

max 를 이용한 방법이 인상깊었다.

현재시각+작업소요시간 , 작업요청시점 + 작업소요시간 중 더 큰 값이 작업을 완료한 시각이 된다.

즉, 디스크가 아무 일도 하지 않는 공백 기간이 있느냐 없느냐의 유무에 따라 선택지가 달라지게 된다.

 

나머지 로직은 나와 비슷하다.

 

댓글