/xmlbench/trunk : revision 2

To get this branch, use:

bzr branch
http://darksoft.org/webbzr/xmlbench/trunk

« back to all changes in this revision

Viewing changes to parse/parabix.20090211/lib/lib_simd.h

Committer: Suren A. Chilingaryan
Date: 2009-09-23 17:13:04 UTC
Revision ID: csa@dside.dyndns.org-20090923171304-osvtr4zqb29h11kd

Intel, Tango, Phobos, and RapidXML parsers; Memory benchmark scripts

files added:
create/intel_dom2

create/intel_dom2.java

parse/intel_dom2

parse/intel_dom2.java

parse/intel_sax2

parse/intel_sax2.java

parse/parabix.20090922

parse/parabix.20090922/lib

parse/parabix.20090922/lib/altivec_simd.h

parse/parabix.20090922/lib/lib_simd.h

parse/parabix.20090922/lib/sse_simd.h

parse/parabix.20090922/lib/sse_simd_t.h

parse/parabix.20090922/lib/stdint.h

parse/parabix.20090922/src

parse/parabix.20090922/src/bitlex.c

parse/parabix.20090922/src/bitlex.h

parse/parabix.20090922/src/bitplex.c

parse/parabix.20090922/src/bitplex.h

parse/parabix.20090922/src/bytelex.h

parse/parabix.20090922/src/byteplex.c

parse/parabix.20090922/src/byteplex.h

parse/parabix.20090922/src/charsets

parse/parabix.20090922/src/charsets/ASCII_EBCDIC.h

parse/parabix.20090922/src/charsets/ASCII_EBCDIC.py

parse/parabix.20090922/src/contentmodel.c

parse/parabix.20090922/src/contentmodel.h

parse/parabix.20090922/src/engine.c

parse/parabix.20090922/src/engine.h

parse/parabix.20090922/src/multiliteral.h

parse/parabix.20090922/src/namechars.h

parse/parabix.20090922/src/stringpool.h

parse/parabix.20090922/src/symtab.c

parse/parabix.20090922/src/symtab.h

parse/parabix.20090922/src/xml_chars.py

parse/parabix.20090922/src/xml_error.c

parse/parabix.20090922/src/xml_error.h

parse/parabix.20090922/src/xmldecl.c

parse/parabix.20090922/src/xmldecl.h

parse/parabix.20090922/src/xmlmodel.c

parse/parabix.20090922/src/xmlmodel.h

parse/phobos-dom.d

parse/phobos-sax.d

parse/rapidxml.cpp

parse/tango-dom.d

parse/tango-pull.d

parse/tango-sax.d

parse/tools.c

parse/tools.d

results.memory

results.memory/xsl.odt.expat-sablotron-dom.dummy

results.memory/xsl.odt.expat-sablotron-dom.parse

results.memory/xsl.odt.expat-sablotron-dom.real

results.memory/xsl.odt.intel-dom.dummy

results.memory/xsl.odt.intel-dom.parse

results.memory/xsl.odt.intel-dom.real

results.memory/xsl.odt.libxml.dummy

results.memory/xsl.odt.libxml.parse

results.memory/xsl.odt.libxml.real

results.memory/xsl.odt.oracle-dom.dummy

results.memory/xsl.odt.oracle-dom.parse

results.memory/xsl.odt.oracle-dom.real

results.memory/xsl.odt.sun_dom2.dummy

results.memory/xsl.odt.sun_dom2.parse

results.memory/xsl.odt.sun_dom2.real

results.memory/xsl.odt.xerces-dom.dummy

results.memory/xsl.odt.xerces-dom.parse

results.memory/xsl.odt.xerces-dom.real

results.memory/xsl.rdf.expat-sablotron-dom.dummy

results.memory/xsl.rdf.expat-sablotron-dom.parse

results.memory/xsl.rdf.expat-sablotron-dom.real

results.memory/xsl.rdf.intel-dom.dummy

results.memory/xsl.rdf.intel-dom.parse

results.memory/xsl.rdf.intel-dom.real

results.memory/xsl.rdf.libxml.dummy

results.memory/xsl.rdf.libxml.parse

results.memory/xsl.rdf.libxml.real

results.memory/xsl.rdf.oracle-dom.dummy

results.memory/xsl.rdf.oracle-dom.parse

results.memory/xsl.rdf.oracle-dom.real

results.memory/xsl.rdf.sun_dom2.dummy

results.memory/xsl.rdf.sun_dom2.parse

results.memory/xsl.rdf.sun_dom2.real

results.memory/xsl.rdf.xerces-dom.dummy

results.memory/xsl.rdf.xerces-dom.parse

results.memory/xsl.rdf.xerces-dom.real

results.memory/xsl.xmlgen4.expat-sablotron-dom.dummy

results.memory/xsl.xmlgen4.expat-sablotron-dom.parse

results.memory/xsl.xmlgen4.expat-sablotron-dom.real

results.memory/xsl.xmlgen4.intel-dom.dummy

results.memory/xsl.xmlgen4.intel-dom.parse

results.memory/xsl.xmlgen4.intel-dom.real

results.memory/xsl.xmlgen4.libxml.dummy

results.memory/xsl.xmlgen4.libxml.parse

results.memory/xsl.xmlgen4.libxml.real

results.memory/xsl.xmlgen4.oracle-dom.dummy

results.memory/xsl.xmlgen4.oracle-dom.parse

results.memory/xsl.xmlgen4.oracle-dom.real

results.memory/xsl.xmlgen4.sun_dom2.dummy

results.memory/xsl.xmlgen4.sun_dom2.parse

results.memory/xsl.xmlgen4.sun_dom2.real

results.memory/xsl.xmlgen4.xerces-dom.dummy

results.memory/xsl.xmlgen4.xerces-dom.parse

results.memory/xsl.xmlgen4.xerces-dom.real

results.memory/xsl.xmlgen64M.expat-sablotron-dom.dummy

results.memory/xsl.xmlgen64M.expat-sablotron-dom.parse

results.memory/xsl.xmlgen64M.expat-sablotron-dom.real

results.memory/xsl.xmlgen64M.intel-dom.dummy

results.memory/xsl.xmlgen64M.intel-dom.parse

results.memory/xsl.xmlgen64M.intel-dom.real

results.memory/xsl.xmlgen64M.libxml.dummy

results.memory/xsl.xmlgen64M.libxml.parse

results.memory/xsl.xmlgen64M.libxml.real

results.memory/xsl.xmlgen64M.oracle-dom.dummy

results.memory/xsl.xmlgen64M.oracle-dom.parse

results.memory/xsl.xmlgen64M.oracle-dom.real

results.memory/xsl.xmlgen64M.sun_dom2.dummy

results.memory/xsl.xmlgen64M.sun_dom2.parse

results.memory/xsl.xmlgen64M.sun_dom2.real

results.memory/xsl.xmlgen64M.xerces-dom.dummy

results.memory/xsl.xmlgen64M.xerces-dom.parse

results.memory/xsl.xmlgen64M.xerces-dom.real

results.memsum

results.memsum/parse.xmlgen256.xerces-dom.dummy

results.memsum/parse.xmlgen256.xerces-dom.real

results.memsum/xsl.xmlgen256.libxml.dummy

results.memsum/xsl.xmlgen256.libxml.parse

results.memsum/xsl.xmlgen256.libxml.real

results.memsum/xsl.xmlgen256.xerces-dom.dummy

results.memsum/xsl.xmlgen256.xerces-dom.parse

results.memsum/xsl.xmlgen256.xerces-dom.real

results.memsum/xsl.xmlgen8192.libxml.dummy

results.memsum/xsl.xmlgen8192.libxml.parse

results.memsum/xsl.xmlgen8192.libxml.real

runbench.memory

runbench.memsum

sample.results/2009.02.16/gcc/results.tcmalloc

validate/intel_dom2

validate/intel_dom2.java

xsl/intel_dom2

xsl/intel_dom2.java

files removed:
create/intel-dom

parse/asmxml

parse/intel-dom

parse/intel-sax

parse/parabix

parse/parabix.20090211

parse/parabix.20090211/lib

parse/parabix.20090211/lib/altivec_simd.h

parse/parabix.20090211/lib/lib_simd.h

parse/parabix.20090211/lib/sse_simd.h

parse/parabix.20090211/lib/sse_simd_t.h

parse/parabix.20090211/lib/stdint.h

parse/parabix.20090211/src

parse/parabix.20090211/src/bitlex.c

parse/parabix.20090211/src/bitlex.h

parse/parabix.20090211/src/bitplex.c

parse/parabix.20090211/src/bitplex.h

parse/parabix.20090211/src/bytelex.h

parse/parabix.20090211/src/byteplex.c

parse/parabix.20090211/src/byteplex.h

parse/parabix.20090211/src/charsets

parse/parabix.20090211/src/charsets/ASCII_EBCDIC.h

parse/parabix.20090211/src/contentmodel.c

parse/parabix.20090211/src/contentmodel.h

parse/parabix.20090211/src/engine.c

parse/parabix.20090211/src/engine.h

parse/parabix.20090211/src/multiliteral.h

parse/parabix.20090211/src/namechars.h

parse/parabix.20090211/src/stringpool.h

parse/parabix.20090211/src/symtab.c

parse/parabix.20090211/src/symtab.h

parse/parabix.20090211/src/xml_chars.py

parse/parabix.20090211/src/xml_error.c

parse/parabix.20090211/src/xml_error.h

parse/parabix.20090211/src/xmldecl.c

parse/parabix.20090211/src/xmldecl.h

parse/parabix.20090211/src/xmlmodel.c

parse/parabix.20090211/src/xmlmodel.h

validate/intel-dom

validate/xerces-sax.cpp

xsl/html.intel

xsl/html.intel.lint

xsl/html.libxml

xsl/html.libxml.lint

xsl/intel-dom

xsl/xerces-sax.cpp

files modified:
.bzrignore

Makefile.in

README

ToDo

create/Makefile

create/expat-cslxml-dom.cpp

create/expat-sablotron-dom.cpp

create/intel-dom.cpp

create/libxml-dom.c

create/libxml.c

create/oracle-dom.c

create/oracle-dom.cpp

create/oracle_dom2

create/qt-dom.cpp

create/sun_dom2

create/sun_dom2.java

create/tools.h

create/xerces-dom.cpp

parse/Makefile

parse/oracle_dom2

parse/oracle_sax2

parse/sun_dom2

parse/sun_dom2.java

parse/sun_sax2

parse/sun_sax2.java

parse/tools.h

parse/xerces-dom.cpp

runbench.1

runbench.compile

security/libxml.c

security/libxml1.c

security/sun_dom2

security/tools.h

security/xerces-dom.cpp

validate/Makefile

validate/bench.java

validate/intel-dom.cpp

validate/libxml.c

validate/sun_dom2

validate/sun_dom2.java

validate/tools.h

validate/tools2.h

validate/xerces-dom.cpp

xmlgen/xmlgen.h

xsl/Makefile

xsl/bench.java

xsl/expat-sablotron-dom.cpp

xsl/intel-dom.cpp

xsl/libxml.c

xsl/oracle-dom.c

xsl/sun_dom2

xsl/tools.h

xsl/tools2.h

xsl/xerces-dom.cpp

Show diffs side-by-side

added added

removed removed

parse/parabix.20090211/lib/lib_simd.h

/* lib_simd_h: SIMD Library including idealized SIMD operations

Licensed to the public under the Open Software License 3.0.

Licensed to International Characters Inc.

under the Academic Free License version 3.0.

This file contains generic architecture-independent definitions,

importing architecture-specific implementations from appropriate

files.

/*------------------------------------------------------------*/

#ifndef LIB_SIMD_H

#define LIB_SIMD_H

#include <sys/types.h>

#include <limits.h>

#if (defined(__i386) || defined(__x86_64))

#ifdef TEMPLATED_SIMD_LIB

#include "sse_simd_t.h"

#endif

#ifndef TEMPLATED_SIMD_LIB

#include "sse_simd.h"

#endif

#ifdef _ARCH_PPC

#include "altivec_simd.h"

#endif

/* Useful definitions from Linux kernel*/

#ifdef __GNUC__

#define likely(x) __builtin_expect((x),1)

#define unlikely(x) __builtin_expect((x),0)

static inline long likely(long x) {

return __builtin_expect(x, 1);

}

static inline long unlikely(long x) {

return __builtin_expect(x, 0);

}

#endif

#ifdef _MSC_VER

#define likely(x) (x)

#define unlikely(x) (x)

#endif

/* Shift forward and back operations, based on endianness */

#if BYTE_ORDER == BIG_ENDIAN

#define sisd_sfl(blk, n) sisd_srl(blk, n)

#define sisd_sbl(blk, n) sisd_sll(blk, n)

#define sisd_sfli(blk, n) sisd_srli(blk, n)

#define sisd_sbli(blk, n) sisd_slli(blk, n)

#define sb_op(x, n) ((x)<<(n))

#define sf_op(x, n) ((x)>>(n))

#define cfzl __builtin_clzl

#endif

#if BYTE_ORDER == LITTLE_ENDIAN

#ifdef TEMPLATED_SIMD_LIB

static inline SIMD_type sisd_sfl(SIMD_type blk, SIMD_type n) {

return simd<128>::sll(blk, n);

}

static inline SIMD_type sisd_sbl(SIMD_type blk, SIMD_type n) {

return simd<128>::srl(blk, n);

}

#define sisd_sfli(blk, n) simd<128>::slli<n>(blk)

#define sisd_sbli(blk, n) simd<128>::srli<n>(blk)

#endif

#ifndef TEMPLATED_SIMD_LIB

static inline SIMD_type sisd_sfl(SIMD_type blk, SIMD_type n) {

return sisd_sll(blk, n);

}

static inline SIMD_type sisd_sbl(SIMD_type blk, SIMD_type n) {

return sisd_srl(blk, n);

}

#define sisd_sfli(blk, n) sisd_slli(blk, n)

#define sisd_sbli(blk, n) sisd_srli(blk, n)

#endif

#define sb_op(x, n) ((x)>>(n))

#define sf_op(x, n) ((x)<<(n))

#ifdef __GNUC__

#define cfzl __builtin_ctzl

#endif

#ifdef _MSC_VER

#include <intrin.h>

#pragma intrinsic(_BitScanForward)

// precondition: x > 0

static inline unsigned long cfzl(unsigned long x) {

unsigned long zeroes;

_BitScanForward(&zeroes, x);

return zeroes;

}

#endif

static inline int count_forward_zeroes(SIMD_type bits) {

100

union {SIMD_type vec; unsigned long elems[sizeof(SIMD_type)/sizeof(long)];} v;

101

v.vec = bits;

102

if (v.elems[0] != 0) return cfzl(v.elems[0]);

103

else if (v.elems[1] != 0) return LONG_BIT + cfzl(v.elems[1]);

104

#ifdef _MSC_VER

105

else if (v.elems[2] != 0) return 2*LONG_BIT + cfzl(v.elems[2]);

106

else if (v.elems[3] != 0) return 3*LONG_BIT + cfzl(v.elems[3]);

107

#endif

108

#ifndef _MSC_VER

109

#if LONG_BIT < 64

110

else if (v.elems[2] != 0) return 2*LONG_BIT + cfzl(v.elems[2]);

111

else if (v.elems[3] != 0) return 3*LONG_BIT + cfzl(v.elems[3]);

112

#endif

113

#endif

114

else return 8*sizeof(SIMD_type);

115

}

116

117

static inline unsigned long bitstream_segment_from(SIMD_type * stream, int bit_posn) {

118

unsigned long * bitstream_ptr = (unsigned long *) (((intptr_t) stream) + bit_posn/8);

119

return sb_op(*bitstream_ptr, bit_posn % 8);

120

}

121

122

/* Scans for a 1 as long as it takes. Use a sentinel to fence.

123

Works for either endianness. */

124

static inline int bitstream_scan(SIMD_type * stream, int bit_posn) {

125

unsigned long * bitstream_ptr = (unsigned long *) (((intptr_t) stream) + bit_posn/8);

126

unsigned long bitstream_slice = sb_op(*bitstream_ptr, bit_posn % 8);

127

if (bitstream_slice != 0) return bit_posn + cfzl(bitstream_slice);

128

else {

129

do {

130

bitstream_ptr++;

131

bitstream_slice = *bitstream_ptr;

132

} while (bitstream_slice == 0);

133

int base_posn = 8*((intptr_t) bitstream_ptr - (intptr_t) stream);

134

return base_posn + cfzl(bitstream_slice);

135

}

136

}

137

138

static inline int bitstream_scan0(SIMD_type * stream) {

139

unsigned long * bitstream_ptr = (unsigned long *) stream;

140

unsigned long bitstream_slice = *bitstream_ptr;

141

int base_posn = 0;

142

while (bitstream_slice == 0) {

143

bitstream_ptr++;

144

bitstream_slice = *bitstream_ptr;

145

}

146

base_posn = 8*((intptr_t) bitstream_ptr - (intptr_t) stream);

147

return base_posn + cfzl(bitstream_slice);

148

}

149

150

151

/* Allocator for arrays of aligned SIMD data values.

152

Ideally the new operator could be used to allocate arrays

153

of vector data aligned on the required boundaries

154

(16-byte for SSE or Altivec). But since this alignment

155

is not guaranteed except on Mac OS X, the following routine

156

is used. */

157

158

static inline SIMD_type * simd_new(size_t SIMD_packs) {

159

#ifdef __APPLE__

160

return new SIMD_type [SIMD_packs];

161

#endif

162

#ifdef _MSC_VER

163

SIMD_type * v = (SIMD_type*)_aligned_malloc(sizeof(SIMD_type) * SIMD_packs, sizeof(SIMD_type));

164

if (v != 0) return v;

165

else {

166

printf("Failed to allocated new array of %i SIMD packs.\n", SIMD_packs);

167

exit(-1);

168

}

169

#endif

170

#if !defined(__APPLE__) && !defined(_MSC_VER)

171

SIMD_type * v;

172

int rslt = posix_memalign((void **) &v,

173

sizeof(SIMD_type),

174

sizeof(SIMD_type) * SIMD_packs);

175

if (rslt == 0) return v;

176

else {

177

printf("Failed to allocated new array of %i SIMD packs.\n", SIMD_packs);

178

exit(-1);

179

}

180

#endif

181

}

182

183

static inline void simd_delete(SIMD_type * blk_ptr) {

184

#ifdef __APPLE__

185

delete [] blk_ptr;

186

#endif

187

#ifndef __APPLE__

188

free((void *) blk_ptr);

189

#endif

190

}

191

192

#endif

193

Older »