[프로그래머스/C++] 디스크 컨트롤러 - 힙(Heap), SJF
- 디스크 컨트롤러
하드디스크는 한 번에 하나의 작업만 수행할 수 있습니다. 디스크 컨트롤러를 구현하는 방법은 여러 가지가 있습니다. 가장 일반적인 방법은 요청이 들어온 순서대로 처리하는 것입니다.
예를들어
- 0ms 시점에 3ms가 소요되는 A작업 요청
- 1ms 시점에 9ms가 소요되는 B작업 요청
- 2ms 시점에 6ms가 소요되는 C작업 요청
와 같은 요청이 들어왔습니다. 이를 그림으로 표현하면 아래와 같습니다.

한 번에 하나의 요청만을 수행할 수 있기 때문에 각각의 작업을 요청받은 순서대로 처리하면 다음과 같이 처리 됩니다.

- A: 3ms 시점에 작업 완료 (요청에서 종료까지 : 3ms)
- B: 1ms부터 대기하다가, 3ms 시점에 작업을 시작해서 12ms 시점에 작업 완료(요청에서 종료까지 : 11ms)
- C: 2ms부터 대기하다가, 12ms 시점에 작업을 시작해서 18ms 시점에 작업 완료(요청에서 종료까지 : 16ms)
이 때 각 작업의 요청부터 종료까지 걸린 시간의 평균은 10ms(= (3 + 11 + 16) / 3)가 됩니다.
하지만 A → C → B 순서대로 처리하면

- A: 3ms 시점에 작업 완료(요청에서 종료까지 : 3ms)
- C: 2ms부터 대기하다가, 3ms 시점에 작업을 시작해서 9ms 시점에 작업 완료(요청에서 종료까지 : 7ms)
- B: 1ms부터 대기하다가, 9ms 시점에 작업을 시작해서 18ms 시점에 작업 완료(요청에서 종료까지 : 17ms)
이렇게 A → C → B의 순서로 처리하면 각 작업의 요청부터 종료까지 걸린 시간의 평균은 9ms(= (3 + 7 + 17) / 3)가 됩니다.
각 작업에 대해 [작업이 요청되는 시점, 작업의 소요시간]을 담은 2차원 배열 jobs가 매개변수로 주어질 때, 작업의 요청부터 종료까지 걸린 시간의 평균을 가장 줄이는 방법으로 처리하면 평균이 얼마가 되는지 return 하도록 solution 함수를 작성해주세요. (단, 소수점 이하의 수는 버립니다)
제한 사항- jobs의 길이는 1 이상 500 이하입니다.
- jobs의 각 행은 하나의 작업에 대한 [작업이 요청되는 시점, 작업의 소요시간] 입니다.
- 각 작업에 대해 작업이 요청되는 시간은 0 이상 1,000 이하입니다.
- 각 작업에 대해 작업의 소요시간은 1 이상 1,000 이하입니다.
- 하드디스크가 작업을 수행하고 있지 않을 때에는 먼저 요청이 들어온 작업부터 처리합니다.
jobs | return |
[[0, 3], [1, 9], [2, 6]] | 9 |
문제에 주어진 예와 같습니다.
- 0ms 시점에 3ms 걸리는 작업 요청이 들어옵니다.
- 1ms 시점에 9ms 걸리는 작업 요청이 들어옵니다.
- 2ms 시점에 6ms 걸리는 작업 요청이 들어옵니다.
이 문제는 힙(Heap)을 이용하여 디스크의 작업 평균시간을 가장 줄이는 방법을 찾는 문제이다.
즉, 프로세스 스케줄링의 SJF 스케줄링(Shortest Job First Scheduling)을 구현하는 문제였다.
학교에서 배웠던 SJF 스케줄링에 대해 간략히 정리해보자면, 사용시간이 가장 작은 프로세스부터 실행시키는 스케줄링으로, 선점 스케줄링이 될수도 비선점 스케줄링이 될 수도 있다.
비선점 SJF 스케줄링은 프로세스가 실행되는 도중 더 작은 사용시간을 가지는 프로세스가 들어오더라도 대기상태/종료상태가 되기 전에는 문맥의 전환이 일어나지 않는다.
반면, 선점 SJF 스케줄링은 문맥의 전환이 일어나며, 이는 SRTF 스케줄링(Shortest Remaining Time First Scheduling)이라고 한다.
이 문제는 비선점 SJF 스케줄링을 구현하면 된다.
#include <string>
#include <vector>
#include <algorithm>
#include <queue>
using namespace std;
struct cmp
{
bool operator() (vector<int> arr1, vector<int> arr2)
{
return arr1[1] > arr2[1];
}
};
int solution(vector<vector<int>> jobs) {
sort(jobs.begin(), jobs.end());
int time = 0;
int totalTime = jobs[0][0];
int index = 1;
priority_queue<vector<int>, vector<vector<int>>, cmp> pq;
pq.push(jobs[0]);
while (!pq.empty())
{
time += (totalTime + pq.top()[1] - pq.top()[0]);
totalTime += pq.top()[1];
pq.pop();
for (; index < jobs.size() && jobs[index][0] <= totalTime; index++)
pq.push(jobs[index]);
if (pq.empty() && index < jobs.size())
{
pq.push(jobs[index]);
totalTime = jobs[index][0];
index++;
}
}
return time / jobs.size();
}
사실 이 문제를 풀고 이해하는데 꽤 오랜 시간이 걸렸었다..
문제 풀이를 헤매이던 핵심적인 이유는, 무조건 디스크들을 작업소요시간 기준으로 오름차순 정렬하여 최소 평균 시간을 만들어내면 될 줄 알았는데, 문제 조건에 "하드디스크가 작업을 수행하고 있지 않을 때에는 먼저 요청이 들어온 작업부터 처리합니다." 가 존재하고 있었다는 것이다...
우선 문제의 풀이방법은 다음과 같다.
(디스크 josb의 구조는 {작업 요청 시간, 작업 소요 시간}이다. )
1. 디스크 jobs는 기본적으로 작업 요청 시간을 기준으로 오름차순 정렬한다.
2. 우선순위 큐는 작업 소요 시간을 기준으로 정렬하도록 만들어두었다.
3. 첫번째 작업은 무조건 하드디스크가 작업을 수행하고 있지 않을 때 들어오기 때문에 바로 힙에 넣어주고 작업을 처리해준다.
4. jobs에 존재하는 디스크들의 작업 요청시간이 현재의 시간보다 작거나 같다면, 과거 혹은 지금 들어온 작업들이므로 힙에 추가해준다.
5-1. 힙에 추가된 요소들이 있다면 다음 while문을 돌면서 top 요소를 꺼내어 차례차례 작업 소요시간이 적은 디스크를 실행시킨다.
5-2. 힙에 추가된 요소가 없지만 모든 디스크를 수행한것이 아니라면, 현재와 이전에 들어온 작업이 없고, 미래에 수행될 작업들만 존재한다는 의미로 jobs의 다음 index인 작업을 바로 heap에 넣어준다. 이후 현재 시간을 방금 추가한 jobs의 시작시간으로 초기화해준다.
(3ms 에서 작업을 기다리는데 다음 작업이 100ms 에 존재한다면, 100ms 작업을 힙에 바로 넣어주고, 시작시간을 100ms로 만드는 것. )
이 문제의 핵심은 기본 디스크 사용 기준으로 "작업요청시간"을 오름차순 정렬한 뒤,
하드디스크가 작업을 수행하고 있을 때 들어오는 요청들은 "작업소요시간"을 기준으로 오름차순 정렬하여 처리하고,
하드디스크가 작업을 수행하고 있지 않을때는 기본 기준 그대로를 순서대로 처리하는 것이다.