/perf/kseta

To get this branch, use:
bzr branch http://darksoft.org/webbzr/perf/kseta

« back to all changes in this revision

Viewing changes to sources/mm/opencl6.c

  • Committer: Suren A. Chilingaryan
  • Date: 2013-09-30 06:47:09 UTC
  • Revision ID: csa@dside.dyndns.org-20130930064709-55cde0k5ci76t8z5
Simple matrix multiplication

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
#include <sys/types.h>
 
2
#include <stdio.h>
 
3
#include <string.h>
 
4
 
 
5
#include <CL/cl.h>
 
6
 
 
7
#define BLOCK_SIZE 16
 
8
 
 
9
#ifndef PPT
 
10
# define PPT 1
 
11
#endif 
 
12
 
 
13
#ifndef SHMEM
 
14
# define SHMEM 1
 
15
#endif
 
16
 
 
17
static cl_int err;
 
18
static cl_platform_id platform = 0;
 
19
static cl_device_id device = 0;
 
20
 
 
21
static cl_context_properties props[3] = { CL_CONTEXT_PLATFORM, 0, 0 };
 
22
static cl_context ctx = 0;
 
23
static cl_command_queue queue = 0;
 
24
 
 
25
static cl_mem dev_res, dev_a, dev_b;
 
26
static cl_mem pinned_mem_res, pinned_mem_a, pinned_mem_b;
 
27
float *pinned_res, *pinned_a, *pinned_b;
 
28
 
 
29
cl_program app;
 
30
cl_kernel kernel;
 
31
 
 
32
size_t matrix_size;
 
33
 
 
34
int exercise_required_alignment = PPT * BLOCK_SIZE;
 
35
 
 
36
int exercise_init(const char *name, size_t size) {
 
37
    int ret = 0;
 
38
    char param[1024];
 
39
 
 
40
    FILE *f;
 
41
    size_t len;
 
42
    char *source;
 
43
 
 
44
    err = clGetPlatformIDs(1, &platform, NULL);
 
45
    if (err != CL_SUCCESS) {
 
46
        printf( "clGetPlatformIDs() failed with %d\n", err );
 
47
        return 1;
 
48
    }
 
49
 
 
50
    err = clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, 1, &device, NULL);
 
51
    if (err != CL_SUCCESS) {
 
52
        printf( "clGetDeviceIDs() failed with %d\n", err );
 
53
        return 1;
 
54
    }
 
55
 
 
56
    err = clGetDeviceInfo(device, CL_DEVICE_NAME, sizeof(param), param, NULL);
 
57
    if (!err) {
 
58
        printf("Using device: %s\n", param);
 
59
    }
 
60
 
 
61
 
 
62
    props[1] = (cl_context_properties)platform;
 
63
    ctx = clCreateContext(props, 1, &device, NULL, NULL, &err);
 
64
    if (err != CL_SUCCESS) {
 
65
        printf( "clCreateContext() failed with %d\n", err );
 
66
        return 1;
 
67
    }
 
68
 
 
69
    queue = clCreateCommandQueue(ctx, device, CL_QUEUE_PROFILING_ENABLE, &err);
 
70
    if (err != CL_SUCCESS) {
 
71
        printf( "clCreateCommandQueue() failed with %d\n", err );
 
72
        clReleaseContext(ctx);
 
73
        return 1;
 
74
    }
 
75
 
 
76
    dev_a = clCreateBuffer(ctx, CL_MEM_READ_ONLY, size * size * sizeof(float), NULL, &err);
 
77
    if (err != CL_SUCCESS) {
 
78
        printf("clCreateBuffer() failed with %d\n", err);
 
79
        return 1;
 
80
    }
 
81
 
 
82
    dev_b = clCreateBuffer(ctx, CL_MEM_READ_ONLY, size * size * sizeof(float), NULL, &err);
 
83
    if (err != CL_SUCCESS) {
 
84
        printf("clCreateBuffer() failed with %d\n", err);
 
85
        return 1;
 
86
    }
 
87
 
 
88
    dev_res = clCreateBuffer(ctx, CL_MEM_READ_WRITE, size * size * sizeof(float), NULL, &err);
 
89
    if (err != CL_SUCCESS) {
 
90
        printf("clCreateBuffer() failed with %d\n", err);
 
91
        return 1;
 
92
    }
 
93
 
 
94
    char *res = calloc(size * size, sizeof(float));
 
95
    if (res) {
 
96
        err = clEnqueueWriteBuffer(queue, dev_res, CL_TRUE, 0, size * size * sizeof(float), res, 0, NULL, NULL);
 
97
        if (err != CL_SUCCESS) {
 
98
            printf("clEnqueueWriteBuffer() failed with %d\n", err);
 
99
            return -1;
 
100
        }
 
101
        free(res);
 
102
 
 
103
        err = clFinish(queue);
 
104
        if (err != CL_SUCCESS) {
 
105
            printf("clFinish() failed with %d\n", err);
 
106
            return -1;
 
107
        }
 
108
    }
 
109
 
 
110
    sprintf(param, "%s.cl", name);
 
111
    f = fopen(param, "r");
 
112
    if (!f) {
 
113
        printf("Can't open file with OpenCL kernels\n");
 
114
        return 1;
 
115
    }
 
116
 
 
117
    fseek(f, 0, SEEK_END);
 
118
    len = ftell(f);
 
119
    fseek(f, 0, SEEK_SET);
 
120
    
 
121
    source = (char*)malloc(len + 128);
 
122
    if (!source) {
 
123
        printf("Can't allocate memory for OpenCL source\n");
 
124
        return 1;
 
125
    }
 
126
    
 
127
    sprintf(source, "#define BLOCK_SIZE %lu\n#define PPT %lu\n\n", BLOCK_SIZE, PPT, PPT);
 
128
    if (fread(source + strlen(source), 1, len, f) != len) {
 
129
        printf("Can't read OpenCL source\n");
 
130
        return 1;
 
131
    }
 
132
    fclose(f);
 
133
 
 
134
    len = strlen(source);
 
135
 
 
136
    app = clCreateProgramWithSource(ctx, 1, (const char**)&source, &len, &err);
 
137
    if (err != CL_SUCCESS) {
 
138
        printf("clCreateProgramWithSource() failed with %d\n", err);
 
139
        return 1;
 
140
    }
 
141
    
 
142
    err = clBuildProgram(app, 1, &device,  "", NULL, NULL);
 
143
    if (err != CL_SUCCESS) {
 
144
        printf("clBuildProgram() failed with %d\n", err);
 
145
        return 1;
 
146
    }
 
147
    
 
148
    free(source);
 
149
    
 
150
    kernel = clCreateKernel(app, "multiply", &err);
 
151
    if (err != CL_SUCCESS) {
 
152
        printf("clCreateKernel() failed with %d\n", err);
 
153
        return 1;
 
154
    }
 
155
 
 
156
    clSetKernelArg(kernel, 0, sizeof(cl_mem), &dev_res);
 
157
    clSetKernelArg(kernel, 1, sizeof(cl_mem), &dev_a);
 
158
    clSetKernelArg(kernel, 2, sizeof(cl_mem), &dev_b);
 
159
    matrix_size = size;
 
160
    clSetKernelArg(kernel, 3, sizeof(unsigned long), &matrix_size);
 
161
    err = clSetKernelArg(kernel, 4, 2 * SHMEM * BLOCK_SIZE * BLOCK_SIZE * sizeof(float), NULL);
 
162
 
 
163
    return 0;
 
164
}
 
165
 
 
166
int exercise_allocate(float **res, float **a, float **b, size_t size) {
 
167
    pinned_mem_a = clCreateBuffer(ctx, CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR, size * size * sizeof(float), NULL, &err);
 
168
    if (err != CL_SUCCESS) {
 
169
        printf("clCreateBuffer() for pinned memory failed with %d\n", err);
 
170
        return 1;
 
171
    }
 
172
    
 
173
    pinned_a = (cl_float*)clEnqueueMapBuffer(queue, pinned_mem_a, CL_TRUE, CL_MAP_WRITE, 0, size * size * sizeof(float), 0, NULL, NULL, &err);
 
174
    if (err != CL_SUCCESS) {
 
175
        printf("clEnqueueMapBuffer() failed with %d\n", err);
 
176
        return 1;
 
177
    }
 
178
 
 
179
    pinned_mem_b = clCreateBuffer(ctx, CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR, size * size * sizeof(float), NULL, &err);
 
180
    if (err != CL_SUCCESS) {
 
181
        printf("clCreateBuffer() for pinned memory failed with %d\n", err);
 
182
        return 1;
 
183
    }
 
184
    
 
185
    pinned_b = (cl_float*)clEnqueueMapBuffer(queue, pinned_mem_b, CL_TRUE, CL_MAP_WRITE, 0, size * size * sizeof(float), 0, NULL, NULL, &err);
 
186
    if (err != CL_SUCCESS) {
 
187
        printf("clEnqueueMapBuffer() failed with %d\n", err);
 
188
        return 1;
 
189
    }
 
190
 
 
191
    pinned_mem_res = clCreateBuffer(ctx, CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR, size * size * sizeof(float), NULL, &err);
 
192
    if (err != CL_SUCCESS) {
 
193
        printf("clCreateBuffer() for pinned memory failed with %d\n", err);
 
194
        return 1;
 
195
    }
 
196
    
 
197
    pinned_res = (cl_float*)clEnqueueMapBuffer(queue, pinned_mem_res, CL_TRUE, CL_MAP_READ, 0, size * size * sizeof(float), 0, NULL, NULL, &err);
 
198
    if (err != CL_SUCCESS) {
 
199
        printf("clEnqueueMapBuffer() failed with %d\n", err);
 
200
        return 1;
 
201
    }
 
202
    
 
203
    *res = pinned_res;
 
204
    *a = pinned_a;
 
205
    *b = pinned_b;
 
206
 
 
207
    return 0;
 
208
}
 
209
 
 
210
 
 
211
void exercise_free() {
 
212
    clReleaseKernel(kernel);
 
213
    clReleaseProgram(app);
 
214
 
 
215
    clEnqueueUnmapMemObject(queue, pinned_mem_a, pinned_a, 0, NULL, NULL);
 
216
    clEnqueueUnmapMemObject(queue, pinned_mem_b, pinned_b, 0, NULL, NULL);
 
217
    clEnqueueUnmapMemObject(queue, pinned_mem_res, pinned_res, 0, NULL, NULL);
 
218
 
 
219
    clReleaseMemObject(pinned_mem_a);
 
220
    clReleaseMemObject(pinned_mem_b);
 
221
    clReleaseMemObject(pinned_mem_res);
 
222
 
 
223
    clReleaseCommandQueue(queue);
 
224
    clReleaseContext(ctx);
 
225
 
 
226
    clReleaseMemObject(dev_res);
 
227
    clReleaseMemObject(dev_b);
 
228
    clReleaseMemObject(dev_a);
 
229
}
 
230
 
 
231
size_t exercise(float *res, float *a, float *b, size_t size, int iterations) {
 
232
    int i;
 
233
    
 
234
    cl_event event = NULL;
 
235
    size_t runtime = 0;
 
236
    cl_ulong start, end;
 
237
 
 
238
    size_t local_size[] = {BLOCK_SIZE, BLOCK_SIZE};
 
239
    size_t global_size[] = {size/PPT, size/PPT};
 
240
 
 
241
    for (i = 0; i < iterations; i++) {
 
242
        err = clEnqueueWriteBuffer(queue, dev_a, CL_TRUE, 0, size * size * sizeof(float), a, 0, NULL, NULL);
 
243
        if (err != CL_SUCCESS) {
 
244
            printf("clEnqueueWriteBuffer() failed with %d\n", err);
 
245
            return -11;
 
246
        }
 
247
 
 
248
        err = clEnqueueWriteBuffer(queue, dev_b, CL_TRUE, 0, size * size * sizeof(float), b, 0, NULL, NULL);
 
249
        if (err != CL_SUCCESS) {
 
250
            printf("clEnqueueWriteBuffer() failed with %d\n", err);
 
251
            return -1;
 
252
        }
 
253
 
 
254
        err = clEnqueueNDRangeKernel(queue, kernel, 2, 0, global_size, local_size, 0, NULL, &event);
 
255
        if (err != CL_SUCCESS) {
 
256
            printf("clEnqueueNDRangeKernel() failed with %d\n", err);
 
257
            return -1;
 
258
        }
 
259
 
 
260
        err = clEnqueueReadBuffer(queue, dev_res, CL_TRUE, 0, size * size * sizeof(float), res, 0, NULL, NULL);
 
261
        if (err != CL_SUCCESS) {
 
262
            printf("clEnqueueReadBuffer() failed with %d\n", err);
 
263
            return -1;
 
264
        }
 
265
 
 
266
        err = clFinish(queue);
 
267
        if (err != CL_SUCCESS) {
 
268
            printf("clFinish() failed with %d\n", err);
 
269
            return -1;
 
270
        }
 
271
        
 
272
        err = clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_START, sizeof(cl_ulong), &start, NULL);
 
273
        if (err != CL_SUCCESS) {
 
274
            printf("clGetEventProfilingInfo() failed with %d\n", err);
 
275
            return -1;
 
276
        }
 
277
        
 
278
        err = clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_END, sizeof(cl_ulong), &end, NULL);
 
279
        if (err != CL_SUCCESS) {
 
280
            printf("clGetEventProfilingInfo() failed with %d\n", err);
 
281
            return -1;
 
282
        }
 
283
        
 
284
        runtime += end - start;
 
285
    }
 
286
 
 
287
    return runtime;
 
288
}
 
289